भाषण मान्यता के हो?

by नेडेम अनथ

तपाईँको आवाजको रूपमा इनपुट विधि प्रयोग गर्दै

स्पीच पहिचान एक प्रविधि हो जसले बोलाइएको आगत प्रणालीहरूमा अनुमति दिन्छ। तपाइँ आफ्नो कम्प्यूटर, फोन वा यन्त्रमा कुरा गर्नुहुन्छ र यसले तपाइँलाई केहि कार्य ट्रिगर गर्न इनपुटको रूपमा भनिन्छ। प्रविधिको इनपुटको अन्य तरिकाहरू जस्तै टाइपिङ, क्लिक वा अन्य तरिकामा छनौट गर्न प्रयोग गर्न प्रयोग भइरहेको छ। यो यन्त्रहरू र सफ्टवेयर अधिक प्रयोगकर्ता-अनुकूल बनाउन र उत्पादकता बढाउनको लागि एउटा माध्यम हो।

त्यहाँ धेरै अनुप्रयोगहरू र क्षेत्रहरू छन् जहाँ भाषण पहिचान प्रयोग गरिन्छ, सेना सहित, खराब व्यक्तिहरूको लागि सहायता (असम्भव व्यक्ति वा कुनै हात वा औंलाहरूको कल्पना गर्नु, चिकित्सा क्षेत्रमा, रोबोटिक्समा आदि। जस्तै) भविष्यमा, लगभग सबैजना सामान्य यन्त्रहरू जस्तै कम्प्यूटर र मोबाईल फोनहरू बीचको प्रचारको कारण भाषण मान्यतामा उजागर गरिनेछ।

केहि स्मार्टफोनले भाषण मान्यताको रोचक प्रयोग गर्दैछ। आईफोन र एन्ड्रोइड उपकरणहरू यसको उदाहरण हुन्। तिनीहरूका माध्यमबाट, तपाईं सम्पर्क गर्न कल गर्न सक्नुहुनेछ बस बोल्ने निर्देशहरू जस्तै 'कल अफिस'। अन्य आदेशहरू पनि 'ब्लूटूथमा स्वीच' जस्तै मनोरञ्जन गर्न सकिन्छ।

भाषण मान्यता संग समस्याहरू

स्पीच पहिचान, यस संस्करणमा स्पीच टेक्स्ट (एसटीटी) को रूपमा चिनिन्छ, यो एक लामो समयको लागि बोलिएको शब्दहरू पाठमा अनुवाद गर्न को लागी प्रयोग गरिएको छ। "तपाइँ बोल्नुहुन्छ, यो प्रकार", जस्तै ViaVoice यसको बक्समा भन्थ्यो। तर त्यहाँ एसटीटीसँग एक समस्या छ जस्तो कि हामी यो थाहा छ। 10 बर्ष भन्दा बढी पछाडि, मैले ViaVoice कोसिस गरेँ र यो मेरो कम्प्युटरमा एक हप्ता अन्तिम हुदैन। किन? यो सकल रूपमा गलत थियो र मैले धेरै समय र ऊर्जा बोल्ने र सबै कुरा टाइप गर्नु भन्दा सुधार गर्न खर्च गरे। ViaVoice उद्योग मा सबै भन्दा राम्रो मध्ये एक हो, यसैले बाँकी कल्पना गर्नुहोस्। प्रविधिले परिपक्व र सुधार गरेको छ, तर टेक्स्टमा भाषण अझै मानिसहरूले प्रश्न सोध्दछ। यसको मुख्य कठिनाइ मध्ये एक शब्दहरु को घोषणा गर्न को बीच धेरै भिन्नताहरु हो।

सबै भाषाहरू भाषण मान्यतामा पर्दैन, र ती प्राय जसो प्रायः अंग्रेजी समर्थित छैन। परिणामको रूपमा, भाषण पहिचान सफ्टवेयर चलाउने धेरै यन्त्रहरू उचित रूपमा मात्र अंग्रेजीसँग गर्छन्।

हार्डवेयर आवश्यकताहरु को एक सेट केहि परिस्थितियों मा तैनात गर्न को लागी भाषण मान्यता को लागी बनाउँछ। तपाईंलाई एक माइक्रोफोन चाहिन्छ जुन पृष्ठभूमि शोरलाई फिल्टर गर्न बुद्धिमानी छ तर एकै समयमा शक्तिशाली हुन्छ जुन स्वाभाविक रूपले आवाज खिच्न सक्छ।

पृष्ठभूमि शोरको बोल्दै, यसले असफल हुन सक्दछ सम्पूर्ण प्रणाली। नतिजाको रूपमा, भाषण मान्यता धेरै कारणहरूमा असफल भए जुन शोरको प्रयोगकर्ताको नियन्त्रणबाट बाहिर छ।

भाषण मान्यतालाई नयाँ फोन र संचार प्रविधिहरूको लागि इनपुट विधिको रूपमा ठूलो बन्द साबित गर्न को लागी सामूहिक पाठ आगतको लागि उत्पादकता उपकरणको तुलनामा।

स्पीच पहिचानको अनुप्रयोग

प्रविधि धेरै क्षेत्रमा लोकप्रियता प्राप्त गर्दैछ र निम्नमा सफल भएको छ:

- यन्त्र नियन्त्रण। केवल "Ok Google" भन्नाले एन्ड्रोइड फोनमा एक प्रणाली जगेडा जुन तपाईंको आवाज आदेशहरूमा सबै कानहरू हो।

- कार ब्लुटुथ प्रणाली। धेरै कारहरू एक प्रणालीसँग सुसज्जित छन् जसले ब्लुटुथ मार्फत तपाईंको स्मार्टफोनमा यसको रेडियो मन्त्रिपरिषद जोड्छ। त्यसपछि तपाई आफ्नो स्मार्टफोन छुन बिना कलहरू गर्न र प्राप्त गर्न सक्नुहुन्छ, र केवल उनीहरूको बोल्नु पनि नम्बर डायल गर्न सक्नुहुन्छ।

- आवाज ट्रान्सक्रिप्शन। क्षेत्रहरूमा जहाँ मानिसहरू धेरै टाइप गर्दछन्, केहि बुद्धिमान सफ्टवेयरले बोल्ने शब्दहरूलाई कैप्चर गर्दछ र तिनीहरूलाई पाठमा ट्राफिक गर्नुहोस्। यो हालको शब्द प्रसोधन सफ्टवेयरमा हाल छ। भ्वाईस ट्रान्सक्रिप्शनले भ्वाईस भ्वाइस मेलको साथ पनि कार्य गर्दछ।

भाषण मान्यता संग समस्याहरू

स्पीच पहिचानको अनुप्रयोग

Alike posts

See Newest

Sapid posts