Author : Rita Singh

Published on Sep 18, 2020 Updated 0 Hours ago

जब बात जटिल विचारों और विचारधाराओं को व्यक्त करने की हो, तो मानवीय भाषा यानी भाषण क्षमता और आवाज़ सबसे शक्तिशाली और प्रभावशाली साबित होते हैं.

डिजिटल दुष्प्रचार और संचार में मानवीय आवाज़ की भूमिका: शोध

इस बात में कोई संदेह नहीं है कि संचार माध्यमों के प्रसार के बाद चरमपंथ और जेनोफोबिया यानी विदेशियों के प्रति नफ़रत और डर का भाव आज कई गुना बढ़कर हम सब की ज़िंदगी का हिस्सा हो गए हैं. इस डर को लगातार दोहराने और लोगों को उकसाने वाली बयानबाज़ी, डिजिटल संचार प्रौद्योगिकी के सहारे बढ़-चढ़ अपना रंग दिखाती है, ख़ासतौर पर उन लोगों पर जो कमज़ोर या अतिसंवेदनशील हैं, या फिर असुरक्षा के भाव से घिरे हैं. ऐसे लोगों पर इस बयानबाज़ी का त्वरित और व्यापक प्रभाव होता है. इससे भी ख़राब बात यह है कि ऐसे लोगों की प्रतिक्रियाएं तेज़ी से लामबंद होती हैं, और जिन लोगों के ख़िलाफ़ उनके मन में नफ़रत हो उन्हें लक्षित कर उनके विरुद्ध काम करने के लिए ये लोग स्वत: ही प्रेरित होते हैं. पूरी दुनिया में बिना किसी लगाम और रोक-टोक के फैल रही कोविड19 की महामारी की तरह, बिना जांच-परख या किसी किस्म के सेंसर के ये जानकारियां उन सभी लोगों को अपना शिकार बनाती हैं, जो मनोवैज्ञानिक रुप से कमज़ोर हों या ख़ुद को लगातार असुरक्षित महसूस करते हों. ये वो लोग हैं जो बिना कुछ सोचे-समझे इस सामग्री को ग्रहण करने और इन बातों को सुनने के लिए तैयार रहते हैं.

ध्वनि का संवेदी प्रभाव

हर व्यक्ति चार अलग-अलग माध्यमों से डिजिटल जानकारी का उपभोग करता है: ऑडियो, वीडियो, चित्र और पाठ यानी टेक्ट. प्रत्येक माध्यम को हमारा मस्तिष्क अलग संवेदी-तंत्रों के ज़रिए समझता और ग्रहण करता है. हर संवेदी तंत्र मस्तिष्क पर अलग प्रभाव डालता है, स्मृतियां बना सकता है, मस्तिष्क को अलग तरह से क्रियाशील बना सकता है, भावनाओं को उद्वेलित कर सकता है और उनके ज़रिए शरीर को कोई कार्रवाई करने के लिए प्रेरित कर सकता है. लेकिन इनमें से हर एक माध्यम जिसे एक इकाई के रूप में समझा जा सकता है भले ही समान रुप और समय तक मस्तिष्क तक पहुंचे, लेकिन इसके बावजूद मन पर अलग-अलग प्रभाव डाल सकता है.

जब बात जटिल विचारों और विचारधाराओं को व्यक्त करने की हो, तो मानवीय भाषा यानी भाषण क्षमता और आवाज़ सबसे शक्तिशाली और प्रभावशाली साबित होते हैं. शाब्दिक जानकारी पर आधारित लिखित प्रसार यानी लिखकर अपनी बात कहना, साक्षरता और दूसरे अवयवों पर आधारित है और इसलिए सीमित भी. इसके अलावा दृश्य माध्यमों की बात करें तो जटिल विचार और संवेदनाओं को दृश्य माध्यमों से व्यक्त करना बेहद मुश्किल और कुछ लोगों के लिए प्रतिबंधक साबित हो सकता है.

ध्वनि और मानवीय आवाज़ मस्तिष्क को कैसे प्रभावित करती है

ध्वनि, दुनिया को समझने के हमारे तरीके और हमारी धारणा पर गहरा प्रभाव डालती है. इसमें लोगों के प्रति हमारी समझ, उनकी बातचीत, उनके इरादे, परिस्थितियां और हमारे आसपास का वातावरण शामिल है.[1]

जो संदेश दृश्य या तस्वीर और लिखित पाठ द्वारा व्यक्त किए जाते हैं, उन्हें जब ध्वनि के साथ संप्रेषित किया जाता है तो वह अधिक तीव्रता और गहराई के साथ हमारे मन-मस्तिष्क में घर करते हैं. ध्वनि के साथ संप्रेषित होने वाले शब्द और तस्वीरें मस्तिष्क को अधिकाधिक सक्रिय करते हैं. यह सक्रियता, हमारे श्रवण तंत्र (auditory cortex) दृश्य-तंत्र (visual cortex) और ललाट (frontal cortex) यानी मस्तिष्क का सामने वाला भाग जो भाषाई जानकारी (बोली जाने वाली भाषा और लिखित भाषा) की हमारी समझ विकसित करता है, के कुल जमा भाग से भी अधिक होती है. मस्तिष्क की अलग-अलग संवेदी इकाईयों से एक साथ पैदा होने वाली संवेदनाएं, संप्रेषण संबंधी सक्रियता को विशिष्ट संवेदी इकाई (“unimodal”) से आगे, बहु-संवेदी इकाई (“heteromodal”) तक स्थानांतरित करती हैं. इसके साथ ही प्रत्येक संवेदी इकाई संप्रेषण संबंधी मस्तिष्क की विशिष्ट संवेदी इकाईयों पर भी प्रभाव डालती है.[2][3]

जबकि यह सभी उद्दीपनों (Stimuli) पर लागू होता है, अन्य अध्ययन यह बताते हैं कि ध्वनि, ‘सह-उत्तेजक’ उत्तेजनाओं के बारे में हमारी धारणाओं पर गहरा प्रभाव डालती है. ध्वनि, मस्तिष्क के ज़रिए दुनिया को लेकर हमारी समझ को न सिर्फ बेहतर बना सकती है, बल्कि बाहरी रूप से कुछ न बदलने की स्थिति में भी, वह हमारी धारणाओं को बदलने की क्षमता रखती है.[4][5][6][7]

सामान्य तौर पर, लोग पाठ्य या दृश्य साक्ष्य की तुलना में, ध्वनिक साक्ष्य पर कम सवाल उठाते हैं, क्योंकि ध्वनि, अदृश्य और व्यापक होने के कारण, अवचेतन पर सीधे असर डालती है और आमतौर पर लोग स्थितप्रज्ञ होकर इस पर “विचार” नहीं करते हैं.

उदाहरण के लिए, पुलिस की बर्बरता पर लिखे एक ऑनलाइन लेख में भागते हुए लोगों की एक तस्वीर, (जिनमें केवल उनकी पीठ दिख रही हो) जिस पर कैप्शन लिखा हो- पुलिस के लाठीचार्ज से अपना बचाव करने के लिए भागते लोग. हो सकता है कि यदि यह घटना असंभव और अविश्वसनीय लगे तो इसमें दिखाई गई तस्वीरों, रिपोर्ट की प्रामाणिकता और तस्वीर और रिपोर्ट में लिखी बातों के सहसंबंध पर सवाल उठाया जा सकता है. लेकिन, जब इसी दृश्य को पुलिस के सायरन की आवाज़ों[9] के साथ प्रस्तुत किया जाए, जिसमें लोग उस समय के हालात और वहां कि स्थिति से संबंधित शब्द चिल्लाते सुनाई हें, तो पूर्वव्यापी प्रतिक्रिया नाकारात्मक होने और पुलिस के आंतक के ख़िलाफ गुस्सा उद्वेलित होने की अधिक संभावना है. ऐसे में लेख किस तरह लिखा गया है, उसमें क्या जानकारी है और किस तरह की तस्वीरें पेश की गई हैं, इन सब पर सवाल उठने की संभावना कम है. वास्तव में,  इस बात की कोई गारंटी नहीं कि ध्वनियाँ और दृश्य सह-घटित हुए हों. सामान्य तौर पर, लोग पाठ्य या दृश्य साक्ष्य की तुलना में, ध्वनिक साक्ष्य पर कम सवाल उठाते हैं, क्योंकि ध्वनि, अदृश्य और व्यापक होने के कारण, अवचेतन पर सीधे असर डालती है और आमतौर पर लोग स्थितप्रज्ञ होकर इस पर “विचार” नहीं करते हैं.

मनुष्य नियमित रूप से आवाज़ के आधार पर अन्य लोगों के बारे में उनकी छवि बनाते हैं. ये इम्प्रेशन यानी छाप इस पर गहरा प्रभाव डालती है, कि वो उक्त व्यक्ति के साथ किस तरह बात की जाए और उनके कहे पर कैसी प्रतिक्रिया दी जाए. मनुष्य की आवाज़, जन उत्तेजना का एक शक्तिशाली औज़ार है और अन्य किसी भी तरह की प्रस्तुति की तुलना में इसके ज़रिए, अधिक तेज़ी से और बड़े पैमाने पर प्रतिक्रियाएं और हिस्टीरिया पैदा किया जा सकता है.[10] उदाहरण के लिए, नाज़ी पार्टी को दिए गए एडॉल्फ हिटलर के भाषण, दर्शकों और श्रोताओं में किस तरह की उन्मादी प्रतिक्रिया पैदा करते थे इसका जवाब उस दौर की सार्वजनिक और ऐतिहासिक रिकॉर्डिंग दे सकती हैं. यह अनुमान लगाया जाता है कि अन्य कारकों के अलावा, अपनी विचारधारा के मुखर वितरण के लिए हिटलर द्वारा दिए गए उन्मादी और ‘प्रेरक’ भाषणों ने, एक सभ्य समाज को जानलेवा और जेनोफोबिक बनाने में अहम भूमिका निभाई.

मनुष्य ध्वनियों के प्रति अतिसंवेदनशील होता है. कुछ मामलों में अगर एक तस्वीर हज़ार शब्दों का काम कर सकती है, तो कई मामलों में, बोला गया एक वाक्य, कई हज़ार चित्रों के बराबर प्रभावी हो सकता है.

आवाज़ और दुष्प्रचार

बात केवल भाषण सामग्री की नहीं, बल्कि मानव आवाज़ की ध्वनि की है, जो व्यक्ति के मन-मस्तिष्क पर प्रभाव डालने और उसे मनोवैज्ञानिक रूप से प्रभावित करने की क्षमता रखती है. इस बात की बहुत अधिक संभावना है कि हिटलर की आवाज़ अगर हास्यास्पद या तीक्ष्ण (उदाहरण के लिए, मिकी माउस की तरह) होती तो वो नाज़ियों को चरमपंथी बनाने की दिशा में इतने कारगर नहीं होते.

डिजिटल दुष्प्रचार में इंसानी आवाज़ की भूमिका को समझने के लिए, यह जानना ज़रूरी है कि डिजिटल दुनिया में मानवीय संभाषण कितने व्यापक स्तर पर फैला है. अक्टूबर 2019 तक, लोगों ने अकेले यू-ट्यूब पर हर दिन पांच बिलियन वीडियो देखे[11]. इस तरह की अनगिनत सामग्री दूसरे कई चैनलों जैसे इंटरनेट सर्च, डिजिटल संचार लाइनों और रेडियो के ज़रिए भी वितरित की जाती है,  जिससे ऑडियो, वीडियो और ऑडियो-विजुअल सामग्री को देखे और सुने जाने का ये आंकड़ा कई और अरब तक पहुंच जाता है. सोशल मीडिया के अलग-अलग माध्यम इन आंकड़ों को और बड़ा बनाते हैं. साल 2017[12] की पहली तिमाही में ही, 5.2 मिलियन उपयोगकर्ताओं ने इंस्टाग्राम पर ब्रांडेड वीडियो देखे.

ऑडियो, वीडियो और ऑडियो-विजुअल सहित लिखित मीडिया की इस बेताहाशा पहुंच का एक बड़ा हिस्सा दुष्प्रचार है. दुष्प्रचार और नकली जानकारियों की इस सामग्री की सही तादाद बताना मुश्किल है, लेकिन मीडिया में इसकी हिस्सेदारी और इसका अंश तेज़ी से बढ़ रहा है.

भाषण के माध्यम से किए गए धोखे के परिणाम, शारीरिक अपराधों से पूरी तरह तुलनीय हैं. वे नकली आर्थिक योजनाओं में लोगों को फंसाने के ज़रिए उनकी आर्थिक तबाही का कारण बनने से लेकर, झूठ बोलकर बेचे गए गलत उत्पादों के इस्तेमाल से होने वाली मौत से भी जुड़े हैं. लोगों तक महत्वपूर्ण और सही जानकारी पहुंचने से रोके जाने के अलावा, हर वो मामला जिसमें गलत जानकारी दी जाए या भाषण को तोड़-मरोड़ कर पेश किया जाए, इस अपराध से जुड़ा है.

भाषण के माध्यम से किए गए धोखे के परिणाम, शारीरिक अपराधों से पूरी तरह तुलनीय हैं. वे नकली आर्थिक योजनाओं में लोगों को फंसाने के ज़रिए उनकी आर्थिक तबाही का कारण बनने से लेकर, झूठ बोलकर बेचे गए गलत उत्पादों के इस्तेमाल से होने वाली मौत से भी जुड़े हैं.

इस तरह के विश्लेषणों से जो बात सामने आती है वह बेहद आश्चर्यजनक और चौंकाने वाली है, कि दुष्प्रचार, नकली जानकारियों और चरमपंथी विचारधाराओं की शुरुआत केवल एक चिंगारी से होती है. संचार चैनल एक सूखे जंगल की तरह इस चिंगारी को पकड़ कर उसे आग में तब्दील कर देते हैं. परिचालन के स्तर पर देखें तो, विद्रोही और नकली जानकारियों के प्रसार की यह समस्या सामग्री को बनाने वालों या उसके प्राप्तकर्ताओं के स्तर पर नहीं बल्कि इसका प्रसार करने वाले माध्यमों के स्तर पर है, क्योंकि मनुष्य अपनी आदतों और मनोवैज्ञानिक झुकाव के आधार पर ही काम करेंगे. मनुष्य कुछ खास परिस्थितियों में खास तरह की प्रतिक्रिया देंगें इसलिए सामग्री के प्रसार को रोकने के लिए उन्हें बदलने से बेहतर माध्यम पर ध्यान केंद्रित करना होगा. हर दिन करोड़ों की संख्या में बन रहे ये संदेश और पूरी तरह से बेरोक-टोक और बिना जांची परखी सामग्री, बाढ़ की तरह हमारे आसपास मौजूद है, और इसे रोकने व इससे निपटने के लिए तकनीकी रूप से माध्यमों को साधना होगा, बजाय इसके कि हम अनगिनत संख्या में मनुष्यों पर ध्यान केंद्रित करें. इस पर हम आगे चर्चा करते हैं.

तकनीकी समाधान

मनोवैज्ञानिक रूप से देखें तो चरमपंथ और कट्टरतावाद, असुरक्षा की भावना और अस्तित्वगत भय से जुड़े होते हैं. ये दोनों ही कई तरह के सामाजिक-आर्थिक कारकों से प्रेरित होते हैं, और व्यक्तियों और समूहों को जीवन के शुरुआती सालों से ही प्रभावित कर रहे होते हैं. ध्यान रहे कि केवल तकनीकी विकास ही इन समूहों की मदद नहीं करते; यह बात साबित करने के पर्याप्त सबूत मौजूद हैं, कि ये लोग वैश्विक नौकरी बाज़ारों में आमूल-चूल बदलाव लाने के लिए काम करते हैं, और उनकी यह कोशिशें, पहले से ही वंचित समूहों को सामाजिक-आर्थिक सीढ़ी से और नीचे धकेल देती हैं. ये गंभीर समस्याएँ हैं और चरमपंथ को सही मायने में ख़त्म करने के लिए इन्हें संबोधित किया जाना चाहिए और इनका समाधान निकाला जाना चाहिए.

हालाँकि, इन सामाजिक-आर्थिक मुद्दों को अलग रख फिलहाल पूरी तरह से मशीनी यानी रोबोटिक तकनीकों और तरीकों पर विचार किया जा सकता है, क्योंकि इस समस्या के तकनीकी नियंत्रण के अलावा फिलहाल कोई ऐसा समाधान नहीं है, जो स्पष्ट और तुरंत कार्रवाई के योग्य हो.

बोले गए शब्दों पर ध्यान केंद्रित होने के साथ, एक महत्वपूर्ण सवाल यह है कि विद्रोही और नकली बयानबाज़ी के मुक्त प्रसार को कैसे रोका जाए? इस मामले में सबसे मोटी चमड़ी का व्यक्ति या यूं कहें कि इकाई वो संदेशवाहक यानी माध्यम है जो बिना सोचे समझे इस सामग्री को वितरित और संचालित कर रहा है. एक सीधा-सरल उपाय यह हो सकता है कि जब तक इस सामग्री को ठीक ढंग से संजोने (curate) के तरीके नहीं निकाल लिए जाते तब तक अधूरे या गैर-प्रभावी रूप में भी जो समाधान उपलब्ध हैं उनका इस्तेमाल किया जाना चाहिए. हमें उम्मीद है कि इससे आम जनता को उकसाने वाली बयानबाज़ी[13] का प्रभाव कम होगा और समय के साथ यह पूरी तरह से निष्क्रिय और अप्रभावी भी हो सकती है. हालांकि, वास्तविक दुनिया में यह पूरी तरह स्वीकार्य समाधान नहीं है. ऐसे में अधिक व्यावहारिक (और स्वीकार्य) वो तकनीकें जो इस तरह की सामग्री की पहचान करने और उसे रोकने का काम कर सकती हैं, उनका उल्लेख नीचे किया जा रहा है.

बोले गए शब्दों पर ध्यान केंद्रित होने के साथ, एक महत्वपूर्ण सवाल यह है कि विद्रोही और नकली बयानबाज़ी के मुक्त प्रसार को कैसे रोका जाए? इस मामले में सबसे मोटी चमड़ी का व्यक्ति या यूं कहें कि इकाई वो संदेशवाहक यानी माध्यम है जो बिना सोचे समझे इस सामग्री को वितरित और संचालित कर रहा है.

भाषण (स्पीच) की पहचान

भाषण यानी बोले गए शब्दों की पहचान से जुड़ी तकनीकें, प्रौद्योगिकी स्तर पर रिकॉर्ड किए गए भाषण के प्रतिलेखन यानी लिखित रूप को उपलब्ध कराए जाने से जुड़ी हैं. वातावरण में तेज़ आवाज़ वाली जगहों और धाराप्रवाह बोली जाने वाली वाणी का प्रतिलेखन अभी भी एक अनसुलझी समस्या है, लेकिन स्वचालित वाक् पहचान (automatic speech recognition) यानी लिखे या बोले गए शब्दों की स्वत: पहचान संबंधी प्रणाली लगातार बेहतर हो रही है. भाषण के प्रतिलेखन संबंधी तकनीकों के आधार पर, विभिन्न स्तरों पर तथ्यों की जाँच के लिए डेटाबेस भी बनाया जा सकता है. एक बार भाषण को पाठ्य रूप में बदल दिए जाने के बाद अन्य प्रभावशाली और प्राकृतिक भाषा प्रसंस्करणों (natural language processing) के ज़रिए सामग्री को एकत्रित किया जा सकता है. ये ऐसी तकनीकें हैं जो सॉफ्टवेयर के ज़रिए प्राकृतिक भाषा को समझने का काम करती हैं, और अलग-अलग तरह की सामग्री को विश्लेषित करने में अहम भूमिका निभा सकती हैं. 

वक्ता की पहचान और सत्यापन

वक्ता की पहचान और सत्यापन से जुड़ी तकनीकें, बेहद सूक्ष्म किंतु विस्तृत ढंग से, आवाज़ को वॉयसप्रिंट डेटाबेस यानी आवाज़ के सूक्ष्म नमूनों के वृहत डाटाबेस से मिलाने पर आधारित हैं. वक्ता के ‘सत्यापन’ की प्रक्रिया की शुरुआत में ही, आवाज़ के नमूने के ज़रिए बोलने वाले की पहचान सुनिश्चित कर दी जाती है और डेटाबेस से आवाज़ के मिलान के ज़रिए, आवाज़ के किसी विशिष्ट व्यक्ति के होने के दावे को सही या गलत सिद्ध किया जाता है. वक्ता की ‘पहचान’ की प्रक्रिया के दौरान व्यक्ति के बारे में कोई जानकारी नहीं होती, इसलिए आवाज़ के नमूने को वॉयसप्रिंट डेटाबेस में मौजूद लोगों की आवाज़ के नमूनों से मिलाया जाता है और इस आधार पर व्यक्ति की पहचान संबंधी जानकारी निकाली जाती है. मशीन-जनित (machine generated) और मानवीय आवाज़ को तोड़-मरोड़ कर अलग-अलग तरीकों से उसके इस्तेमाल के ज़रिए दुष्प्रचार, गलत बयानी और नकली जानकारियां वितरित करने के मामलों में इन तकनीकों का इस्तेमाल कर निगरानी की जा सकती है.

भाषण संबंधी पैरालिंग्युस्टिक (paralinguistics)

पैरालिंग्युस्टिक शब्द की उत्पत्ती एक दूसरे शब्द paralanguage यानी स्वरों से उपजने वाली भाषा, से हुई है. यह भाषण-आधारित संचार के उन पहलुओं से जुड़ा है, जो बोले गए शब्दों के अर्थ को सारगर्भित बनाने और परिवर्तित करने का काम करते हैं. भाषण-आधारित संचार के ये पहलू बोलने वाले की भावना, उसके लक्ष्य और उसके संदर्भ को बिना शब्दों का इस्तेमाल हुए भी संप्रेषित कर सकते हैं. पैरालिंग्युस्टिक के ज़रिए, भाषण को मेटा यानी आंकड़ों की सबसे छोटी इकाई के रूप में चिह्नित कर आवाज़ में मौजूद विभिन्न (असंगत) भावनाओं, झूठ और धोखा देने वाली सूक्ष्म जानकारियों का पता लगाया जा सकता है. हालांकि, ये तकनीकें अपनी सटीकता में सीमित हैं, क्योंकि उनका सटीक और शब्दश: सही होना, मनुष्यों द्वारा चिन्हित (लेबल) किए गए डाटा पर निर्भर करता है, और मनुष्य केवल उतने ही सटीक लेबल लगा सकते हैं, जितना वे ख़ुद सही रूप से समझ सकें और आत्मसार कर सकें.

आवाज़ की रूपरेखा तैयार करना

वॉयस प्रोफाइलिंग यानी आवाज़ की रूपरेखा तैयार करना, बोलने वाले की आवाज़ के विश्लेषण के ज़रिए[14] उसके बारे में अधिक से अधिक और ऐसी जानकारी जुटाना है जो उसका सामाजिक-मनोवैज्ञानिक विश्लेषण कर सके.  मनुष्य की आवाज़ एक शक्तिशाली जैव-पैरामीट्रिक संकेतक है. आवाज़ उन सूचनाओं को वहन करती है जो व्यक्ति और उसके समय (आवाज़ की रिकॉर्डिंग के समय) बोलने वाले की भौतिक, शारीरिक, जनसांख्यिकीय, समाजशास्त्रीय, चिकित्सीय, मनोवैज्ञानिक और अन्य विशेषताओं के बारे में संकेत दे सकती हैं.

वॉयस प्रोफाइलिंग तकनीक हमें आवाज़ के उन पहलुओं के बारे में भी बता सकती है, जो बोलने की गुणवत्ता यानी आवाज़ की लय और तान को प्रभावित किए बिना, जानकारी या सामग्री को अधिक सौम्य बना सकते हैं, या उन्हें कुछ हद तक बेअसर कर सकते हैं. इस संबंध में ये तकनीकें शायद हमें एक मिकी माउस सल्यूशन तक पहुंचा सकती हैं, यानी इस समस्या को हल करने का एक दुष्ट और अप्रिय (किंतु स्वीकार्य) तरीका, जिसे लागू कर आवाज़ जनित माध्यमों में निहित विश्वास, नियंत्रण और नेतृत्व संबंधी गुणों को दूर किया जा सके ताकि वो कम प्रभावी हो.

निष्कर्ष 

ध्वनिक दृष्टिकोण से देखें तो विद्रोही और दुष्प्रचार से जुड़ी विचारधाराओं के प्रसार को रोकने, और इस समस्या से निपटने के लिए एकमात्र कार्रवाई, इस सामग्री को वितरित करने वाले माध्यमों पर काम करना हो सकता है. बजाय इसके कि हम उन कारकों को संशोधित करने की कोशिश करें जो इस तरह के संदेश भेजने के लिए लोगों को उकसाते हैं, या फिर उन लोगों की सोच को बदलने की कोशिश करें जो इन संदेशों के प्राप्तकर्ता, ग्राहक या श्रोता हैं.

ध्वनि के ज़रिए सूचनाएं और अन्य सामग्री वितरित करने वाले चैनलों को निष्पक्ष रूप से विश्लेषित किया जाना चाहिए ताकि घृणा, द्वेष और उकसावे वाली सामग्री फैलाने में इन वितरण तंत्रों और ध्वनि की भूमिका को समझा जा सके.

ध्वनि के ज़रिए सूचनाएं और अन्य सामग्री वितरित करने वाले चैनलों को निष्पक्ष रूप से विश्लेषित किया जाना चाहिए ताकि घृणा, द्वेष और उकसावे वाली सामग्री फैलाने में इन वितरण तंत्रों और ध्वनि की भूमिका को समझा जा सके. इसके तहत वॉयस तकनीक के ज़रिए सबसे ज़्यादा नुक़सानदेह सामग्री की पहचान की जानी चाहिए. जो चैनल प्रति व्यक्ति, प्रति यूनिट जनसंख्या और समय की यूनिट के हिसाब से सबसे अधिक मात्रा में ध्वनिक सामग्री प्रस्तुत और वितरित करते हैं, उनके लिए कुछ न्यूनतम नियामक मानक बनाए जाने चाहिए, ताकि वो इन मानकों के हिसाब से जांची-परखी और सत्यापित सामग्री ही वितरित करें. फिर भले ही इस काम को करने के पहले चरण में ये नियम, सामान्य जांच-परख और वैज्ञानिक आधार पर सही सामग्री जुटाने जैसे सरल तरीके अपनाने पर आधारित हों.


Endnotes

[1] John Neuhoff, “Ecological psychoacoustics”, Brill & The Hague Academy of International Law, July 6, 2004.

[2] Emiliano Macaluso and Jon Driver, “Multisensory spatial interactions: a window onto functional integration in the human brain”, Trends in Neurosciences 28, no. 5 (2005): 264-271.

[3] Jon Driver and Charles Spence, “Multisensory perception: beyond modularity and convergence”, Current Biology 10, no. 20 (2000): R731-R735.

[4] Ladan Shams, Yukiyasu Kamitani, Samuel Thompson, and Shinsuke Shimojo, “Sound alters visual evoked potentials in humans”, Neuroreport 12, no. 17 (2001): 3849-3852.

[5] Tony Ro, Johanan Hsu, Nafi E. Yasar, L. Caitlin Elmore, and Michael S. Beauchamp, “Sound enhances touch perception”, Experimental Brain Research 195, no. 1 (2009): 135-143.

[6] Bernhard E. Riecke, Daniel Feuereissen, John J. Rieser, and Timothy P. McNamara, “Spatial-ized sound enhances biomechanically-induced self-motion illusion (vection)”, in Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, 2011, 2799-2802.

[7] Katsumi Watanabe and Shinsuke Shimojo, “When sound affects vision: effects of auditory grouping on visual motion perception”, Psychological Science 12, no. 2 (2001): 109-116.

[8] Ladan Shams and Robyn Kim, “Crossmodal influences on visual perception”, Physics of Life Reviews 7, no. 3 (2010): 269-284.

[9] Casey O’Callaghan, “Perception and multimodality.” Oxford Handbook of Philosophy of Cognitive Science (2012): 92-117.

[10] Jonathan Leader Maynard and Susan Benesch, “Dangerous speech and dangerous ideology: An integrated model for monitoring and prevention”, Genocide Studies and Prevention 9, no. 3 (2016): 70-95.

[11] Mitja Rutnik, “YouTube in numbers: Monthly views, most popular video, and more fun stats!”, Android Authority, August 11, 2019.

[12] The Top 10 Instagram Video Statistics Marketers Should Know”, MediaKix, December 17, 2018.

[13] Casey A Klofstad, Rindy C Anderson, Susan Peters, “Sounds like a winner: voice pitch influences perception of leadership capacity in both men and women”, Proceedings of the Royal Society B: Biological Sciences 279, no. 1738 (2012): 2698-2704.

[14] Rita Singh, Profiling Humans from their Voice. Singapore: Springer, 2019.

The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.