Google Books मा 'नग्राम दर्शक' उपकरण कसरी प्रयोग गर्ने

एक Ngram, सामान्यतया एन-ग्र्याम भनिन्छ पाठ वा भाषण सामग्रीको सांख्यिकीय विश्लेषण पाठमा केही प्रकारको n (एक नम्बर) फेला पार्न। यो सबै प्रकारका चीजहरू हुन सक्छ, जस्तै फोनेटेम, उपसर्ग, वाक्यांशहरू, वा अक्षरहरू। यद्यपि एन-ग्र्याम केहि शोधकर्ता को बाहिर बाहिर अस्पष्ट छ, यो वास्तव मा विभिन्न क्षेत्रहरुमा प्रयोग गरिन्छ, र यसको लागी मान्छे को कम्प्यूटर प्रोग्रामहरु लाई समझने र प्राकृतिक बोलने वाला भाषा संग प्रतिक्रिया को लागी धेरै प्रभावहरु छ। त्यो, संक्षेपमा, यो विचारमा Google रुचि हुनेछ।

Google Books Ngram Viewer को सन्दर्भमा, टेक्स्ट विश्लेषण गर्न आधिकै पुस्तकहरु बाट आउँछ Google ले सार्वजनिक पुस्तकालयहरूबाट स्क्यान गरेको छ उनीहरूको गुगल किताब खोज इन्जिनमा भर्न। Google Books Ngram Viewer को लागि, उनीहरूलाई पाठ "तपाइँ" को रूप मा खोजी गर्न जाँदै हुनुहुन्छ "कोर्स्पस।" एनग्राम भ्यूममा कर्पोरेट भाषाद्वारा विभाजित गरिन्छ, यद्यपि तपाईं अलग-अलग ब्रिटिस र अमेरिकन अंग्रेजीको विश्लेषण गर्न सक्नुहुन्छ वा उनीहरूलाई साथमा लैम्प गर्न सक्नुहुन्छ। यसले सर्तहरू ब्रिटिशदेखि अमेरिकन प्रयोगको टगल गर्न सुपर रोचक हुन समाप्त गर्दछ र चार्टहरू परिवर्तनलाई हेर्छन्।

कसरी एनग्राम काम गर्दछ

  1. Books.google.com/ngrams मा Google Books Ngram Viewer मा जानुहोस्।
  2. वस्तुहरू केस-संवेदनशील छन्, Google वेब खोजहरू विपरीत, त्यसैले उचित nouns को पूँजीकरण गर्न निश्चित हुनुहोस्।
  3. कुनै पनि वाक्यांश वा वाक्यांशहरूमा तपाईंले विश्लेषण गर्न चाहानुहुन्छ। अल्पविरामसँग प्रत्येक वाक्यांशलाई अलग गर्न निश्चित हुनुहोस्। Google ले तपाईंलाई सुरू गर्न "अल्बर्ट आइंस्टीन, शेरलले होम्स, फ्रान्कस्टेनन" लाई सुझाव दिन्छ।
  4. अर्को, मिति दायरामा टाइप गर्नुहोस्। डिफल्ट 1800 देखि 2000 सम्म छ, तर त्यहाँ भर्खरैका पुस्तकहरू छन् (2011 Google को कागजातमा भर्खरै सूचीबद्ध गरिएको थियो, तर त्यो परिवर्तन भएको हुन सक्छ।)
  5. एक कोरस छान्नुहोस्। तपाईले विदेशी भाषा पाठहरू वा अंग्रेजी खोज्न सक्नुहुन्छ र मानक छनौटहरूसँग तुलना गर्न सक्नुहुन्छ, तपाईंले तलका कुराहरू "अंग्रेजी (200 9 200) वा अमेरिकी अंग्रेजी (200 9)" देख्न सक्नुहुन्छ। यो पुरानो कर्पोरेट हो जुन गुगल पछि अद्यावधिक भएको छ, तर तपाइँसँग तपाइँको पुरानो डेटा सेट विरुद्धको तुलना गर्न केहि कारण हुन सक्छ। धेरै प्रयोगकर्ताहरूले तिनीहरूलाई बेवास्ता गर्न र हालैको कर्पोरेटमा फोकस गर्न सक्छन्।
  6. आफ्नो स्मोनेसिंग स्तर सेट गर्नुहोस्। स्मोमिङले अन्तमा ग्राफ कसरी कति चिकाउँछ भनेर बुझाउँछ। सबैभन्दा सही प्रतिनिधित्व एक स्मोनेस स्तर 0 हुनेछ, तर पढ्न गाह्रो हुन सक्छ। पूर्वनिर्धारित सेट 3 मा सेट गरिएको छ। प्रायजसो अवस्थामा, तपाईंले यो समायोजन गर्न आवश्यक छैन।
  1. खोजीका पुस्तकहरू धेरै बटन थिच्नुहोस्। (तपाइँले खोजी प्रम्प्टमा भर्खर मात्र प्रविष्टि गर्न सक्नुहुन्छ।)

Ngram के देखाउँदैछ?

Google Books Ngram Viewer ले ग्राफलाई आउटपुट गर्दछ जुन समयको माध्यमबाट पुस्तकहरूमा विशेष वाक्यांशको प्रयोग को प्रतिनिधित्व गर्दछ। यदि तपाईंले एक भन्दा बढी शब्द वा वाक्यांश प्रविष्ट गर्नुभएको छ भने, तपाइँ फरक खोज सर्तहरूको विपरीत गर्न रङ-कोडित लाइनहरू देख्नुहुनेछ। यो Google Trends को लागी एकदम राम्रो छ, केवल खोज लामो समयको समय आवरण गर्दछ।

यहाँ एक वास्तविक जीवन उदाहरण हो। हाल हालका सिरका पाइज बारेमा उत्सुक थिए। तिनीहरू लरा इनगल्स विल्डरको सानो हाउस प्रेरी सीरीजमा उल्लेख गरिएको छ, तर हामीले कहिल्यै यस्तो कुरा सुनेनन्। हामी पहिले Google को वेब खोजी प्रयोगका लागि सिरका पाईहरू बारे जान्न सकेनौं। जाहिर छ, तिनीहरू अमेरिकन दक्षिणी व्यञ्जनको भाग मानिन्छ र वास्तव मा सिरकाबाट बनाइन्छ। तिनीहरूले कहिलेकाहीँ सबैलाई वर्षको हरेक पटक ताजा उत्पादनमा पहुँच गर्न सकेन। के त्यो सम्पूर्ण कथा हो?

हामीले Google Ngram दर्शक खोज्यौं, र 1 9 40 मा प्रारम्भिक र अन्तिम दुवै पाईको केही उल्लेखहरू छन्, 1 9 40 मा धेरै उल्लेखहरू, र हालको समयहरूमा बढ्दो सङ्ख्या (शायद केहि पाई नोस्ट्रियगिया।) राम्रो छ, त्यहाँ केहि छ एक स्मोथिंग स्तर मा डाटा संग समस्या 3. 1800s मा उल्लेख मा एक प्लेटाउ छ। निस्सन्देह त्यहाँ हरेक वर्ष एक विशेष पाइको पाँच वर्षसम्मको समान संख्या थिएन? के यो जाँदैछ किनकि त्यस समयमा प्रकाशन गरिएका धेरै पुस्तकहरू छैनन्, र किनभने हाम्रो डेटा सुचारुमा सेट गरिएको छ, यसले तस्विरलाई बिर्साउँछ। सायद त्यहाँ एउटा पुस्तक थियो जुन सिरका पाई उल्लेख गरिएको थियो, र यो एक स्पाइकबाट बच्नको लागि एकैचोटि प्राप्त भयो। 0 मा स्मोनेसिंग गरेर, हामी देख्न सक्छौं कि यो वास्तवमा यो मामला हो। 1869 मा स्पाइक सेन्टरहरू, र 18 9 7 9 1 9 00 मा अर्को चिसो छ।

कुनै पनि सिरका बारे बाँकी कुरा गरे बाँकी समय बाँकी छ? उनीहरूले ती पाईहरूको बारेमा कुरा गरे। त्यहाँ सम्भवतः व्यञ्जनहरू सबै ठाउँहरूमा तैरिरहेका थिए। तिनीहरूले भर्खरै उनीहरूलाई पुस्तकहरूमा लेखेनन् , र त्यो यी नग्राम खोजीहरूको सीमा हो।

उन्नत Ngram खोजहरू

सम्झनुहोस् हामीले कसरी भन्यौं कि न्रामम विभिन्न टेक्स्ट खोजका सबै प्रकारका हुन सक्दछ? Google ले तपाईंलाई Ngram दर्शकसँग एकदम थोडा सार्न अनुमति दिन्छ। यदि तपाईं माछा खोज्न चाहानुहुन्छ भने क्रियाकलाप माछाको सट्टा क्रिया, ट्यागहरू प्रयोग गरेर तपाइँ त्यसो गर्न सक्नुहुन्छ। यस अवस्थामा, तपाइँ "fish_VERB" को लागि खोजी गर्नुहुनेछ

Google ले कमाउन सक्ने आदेशहरूको पूर्ण सूची र उनीहरूको वेबसाइटमा अन्य उन्नत कागजात प्रदान गर्दछ।