Published on Sep 03, 2020 Commentaries 0 Hours ago

डिजिटल अपप्रचारात मानवी आवाज खूप महत्त्वाचा आहे. हिटलरच्या प्रक्षोभक भाषणांमुळेच नाझी पक्षाचे कार्यकर्ते ज्यूंच्या वंशविच्छेदाठी सज्ज झाले, हा इतिहास आहे.

मानवी आवाज आणि अपप्रचार

संपर्काची, दळणवळणाची जितकी म्हणून साधने सध्याच्या जगात उपलब्ध आहेत, त्यांच्या अतिवापरामुळे कट्टरपणा आणि परदेशी लोकांबद्दल वाटणारा तिरस्कार (झेनोफोबिया) झपाट्याने पसरत चालला आहे, यात तिळमात्र शंका नाही. या सगळ्याला चिथावणी देणा-या आक्रमक भाषेला डिजिटल संपर्क तंत्रज्ञानाची जोड मिळते आणि त्याचा निमिषार्धात जगभर प्रसार होतो. या आक्रमक भाषेला सहजी बळी पडतील, अशा लोकांपर्यंत ती बरोब्बर पोहोचेल अशी तजवीज केली जाते आणि त्याचा परिणामही अचूक होतो. मग त्यावर सुरू होतो विखारी भाषेतील प्रतिक्रियांचा सिलसिला. या विखारी भाषेतील प्रतिक्रिया झपाट्याने पसरवल्या जातात आणि त्या ज्यांना उद्देशून आहेत त्यांच्यापर्यंत त्या पोहोचतील याची विशेष काळजी घेतली जाते. अशाच प्रकारे जगभरात अपप्रचार आणि त्यामुळे जगभरातील तणावात भर पडते. जे कोणाचेच ऐकण्याच्या मनःस्थितीत नसतात ते लोक या जाळ्यात अगदी अलगद सापडतात. 

ध्वनीसंवेदनांचा माणसांवर होणारा प्रभाव

साधारणतः ऑडिओ, व्हिडीओ, छायाचित्रे आणि मजकूर या चार माध्यमांतून लोक डिजिटल माहिती मिळवित असतात. आपल्यापर्यंत पोहोचणारी प्रत्येक डिजिटल माहिती मेंदूच्या विविध संवेदन मार्गांतून समजून घेऊन त्यावर प्रक्रिया केली जाते. यातून प्रत्येक माहितीचा काही एक असा ठसा आपल्यावर उमटतो आणि तो दीर्घकाळपर्यंत स्मरणात राहतो. काही माहितीमुळे मन चिथावले जाते, भावना आणि विचार उद्दिपीत होतात आणि त्यांचे रुपांतर अर्थातच क्रियेमध्ये होते. मात्र, प्रत्येक पद्धतीचा स्वतंत्र कप्पा मनात तयार होऊन त्याला त्याच तीव्रतेने प्रतिक्रिया दिली जाते आणि त्याचा परिणाम विविध प्रमाणात होत जातो. 

जटील, गुंतागुंतीच्या संकल्पना आणि आदर्श इतरांपर्यंत पोहोचविण्याची वेळ येते, तेव्हा माणसाची वाचा (आणि माणसाचा आवाज) सर्वाधिक शक्तिशाली आणि प्रभावशाली बनते. लिखित मजकूर वा संदेश यांना साक्षरतेची मर्यादा आहे. म्हणजे साक्षर लोकांपर्यंत तो मजकूर पोहोचतो आणि वाचला जातो, त्यावर प्रतिक्रिया व्यक्त केली जाते. गुंतागुंतीच्या आदर्शवादांना मात्र असे आभासी चित्रांनी वगैरे लोकांपर्यंत पोहोचवले जाऊ शकत नाही. त्यासाठी वक्तृत्वशैलीवरच विसंबून राहावे लागते. 

ध्वनी आणि मानवी आवाज मेंदूवर कसा काय परिणाम साधतात?

जगाचे, लोकांचे आपल्याला नीट आकलन व्हावे, त्यांच्याशी संवाद साधला जावा, लोकांच्या मनातील नीट समजावे, परिस्थितीची जाणीव व्हावी आणि आपल्या भोवतालाची समज यावी या सर्व प्रक्रियांमध्ये ध्वनी कळीची भूमिका निभावत असतो. आपल्या आकलनशक्तीवर ध्वनीचा खोल परिणाम होत असतो. सचित्र वा लिखित संदेशांना जेव्हा ध्वनीची जोड दिली जाते तेव्हा त्या संदेशाची तीव्रता वाढते आणि माणसाच्या मनात तो संदेश खोलवर कोरला जातो. 

संदेशाची परिणामकारकता वाढते. प्रतिमा आणि संदेश यांना जेव्हा ध्वनीची जोड दिली जाते त्यावेळी भाषिक माहितीवर (बोली भाषा आणि लिखित मजकूर यांवेळी भाषा प्रक्रिया कप्पे सक्रिय होतात) प्रक्रिया करणा-या मेंदूतील ऑडिटरी कॉर्टेक्स (श्रवण कप्पा), व्हिज्युअल कॉर्टेक्स (दृश्य कप्पा) आणि फ्रण्टल कोर्टेक्स (पुढील बाजूचा कप्पा) यांच्या एकत्रित बेरजेने (युनिमोडल प्रोसेसिंग एरिया) होणा-या प्रक्रियेहून अधिक प्रमाणात सक्रिय होतात. त्याचवेळी बहुसंवेदन इनपुट्स (कच्चा माल) क्रियाकलापांचे मेंदूतील ध्वनिविशेष कोर्टिसेसमध्ये (युनिमोडल) वहन करतात आणि तेव्हाच ध्वनीच्या प्रत्येक इनपुटचा मेंदूच्या युनिमोडल प्रक्रिया क्षेत्रांवर प्रत्यक्ष परिणाम होतो. 

हे सर्व उद्दिपनांना लागू असले तरी, इतर अभ्यासांमध्ये ध्वनीचा खोल परिणाम आपल्या सहउद्दिपनांसंदर्भातील आकलनांवर होत असल्याचे निदर्शनास आले आहे. ध्वनी केवळ आपल्या जगाबद्दलच्या संवेदना वृद्धिंगत करत नसतो तर त्या बदलवतही असतो. 

उदाहरणार्थ, पोलीस अत्याचाराबाबतच्या ऑनलाइन लेखात लोक पळत असल्याचे (त्यांची केवळ पाठच दिसत असेल) चित्र दाखवून त्याखाली ‘पोलिसांचा मार चुकविण्यासाठी आसरा शोधणारे लोक’ अशी ओळ दिली असेल. जर असा प्रसंग घडणे अशक्य असेल, तर त्याचे दृश्य सादरीकरण आणि लेखाची सत्यता आणि त्यांचे परस्परसंबंध यांबाबत प्रश्न निर्माण केले जातील. मात्र, याच लेखाला पोलिसांच्या सायरनच्या ध्वनीची साथ दिली गेली. लोकांचा आरडाओरड, भयग्रस्त गर्दीची भाषा इत्यादी त्यात मिसळले गेले, तर नक्कीच त्यावर तीव्र प्रतिक्रिया उमटून पोलिसांविरोधात असंतोष पसरेल. या वृत्तावर कोणीही आक्षेप घेणार नाही किंवा त्याच्या सत्यतेवर कोणी प्रश्न विचारणार नाही. तसेच हे घडलेच नसेल किंवा घडले नाही, याबाबत कोणी शंका उपस्थित करणार नाही. साधारणतः लोक लेखी किंवा दृश्यात्मक घटनांऐवजी ध्वनीची पार्श्वभूमी असलेल्या घटनांबद्दल शंका व्यक्त करतात. कारण ध्वनी अदृश्य आणि व्यापक असतो तो कोणीही अगदी अचूकपणे टिपू शकतो. 

साधारणतः माणसाच्या आवाजावरून त्याच्या स्वभावाचा अंदाज लोक लावतात. समोरच्या व्यक्तीचा आवाज कसा आहे यावरून त्याचे व्यक्तिमत्व कसे असेल, याचा अंदाज लावून मग त्या व्यक्तीशी कसे बोलायचे आणि कसे वागायचे, याचा निर्णय घेतला जातो. हा मनुष्य प्राण्याचा नैसर्गिक स्वभाव आहे. आपल्या धीरगंभीर, खर्जातल्या, अधिकाराच्या वा भारावून टाकणा-या आवाजामुळे माणसांना लोकांवर मोहिनी घालता येते, त्यांना चिथावणी देता येते, प्रोत्साहित करता येते, उत्तेजित करता येते. 

जर्मनीचा हुकुमशहा अडॉल्फ हिटलर याने नाझी पक्षाच्या सदस्यांना उद्देशून केलेली भाषणे हे या सर्व गुणांचे उत्तम उदाहरण आहे. हिटलरच्या प्रक्षोभक भाषणांमुळे नाझी पक्षाचे कार्यकर्ते भारावून जात. अतिशय मंत्रमुग्ध करणारी भाषणे होती हिटलरची. त्याच्या या भाषणांमुळेच प्रेरित होऊन अनेक जण ज्यूंच्या वंशविच्छेदाठी सज्ज झाले. हा इतिहास ताजा आहे. ध्वनीच्या प्रति माणसाचे मन अधीर आणि संवेदनक्षम असते. काही वेळा एखादे चित्रही हजार शब्दांचे काम करून जाते. तसेच बोलले गेलेले एखादे वाक्यही हजार चित्रांचे काम करून जाते. 

आवाज आणि अपमाहिती

माणसांना, लोकांच्या गर्दीला, जनसमूहाला प्रेरित, उत्तेजित करण्यासाठी केवळ वाक्चातुर्यच पुरेसे असते असे नाही तर त्या नेत्याचा आवाजही त्यात महत्त्वाची भूमिका बजावत असतो. हिटलरचा आवाज काहीसा विनोदी ढंगाचा (उदाहरणार्थ मिकी माऊससारखा) होता परंतु त्याच्या वक्तृत्वाची मोहिनी इतकी जबरदस्त होती की, तो नाझींना कट्टरतेकडे नेण्यास कमालीचा यशस्वी ठरला. 

डिजिटल अपमाहितीमध्ये माणसाच्या आवाजाची भूमिका समजण्यासाठी, मानवी वक्तव्याची डिजिटल जगातील व्याप्ती किती मोठी आहे, हे समजून घेणे आवश्यक आहे. ऑक्टोबर, २०१९ पर्यंत लोकांनी दरदिवशी ५ अब्ज व्हिडिओ पाहिले, तेही केवळ यू-ट्यूबवर! तोच मजकूर इंटरनेट, डिजिटल कम्युनिकेशन लाइन्स आणि रेडिओ यांच्या माध्यमातून विविध स्तरावरून प्रसारित करण्यात आल्याने दृक-श्राव्य पद्धतीने तो अब्जावधी लोकांपर्यंत पोहोचला. त्यात विविध समाजमाध्यमांची भर पडली. २०१७च्या पहिल्या तिमाहीत ५२ लाख वापरकर्त्यांनी इन्स्टाग्रामवरील ब्रॅण्डेड व्हिडिओ पाहिले. 

हा सातत्याने वाढत असलेला माध्यमांचा धबधबा निर्विवादपणे अपमाहितीचा झपाट्याने प्रसार करत असतो. वक्तृत्वाच्या माध्यमातून करण्यात आलेल्या या फसवणुकीचे परिणाम शारीरिक हिंसेसमान असतात. त्यात मानसिक आजारपण, लोकांना भूलथापा देऊन, त्यांची आर्थिक फसवणूक करत उद्ध्वस्त करणे, सुरक्षित असल्याचे भासवून वस्तूंचा अपवापर करत लोकांच्या मृत्यूला कारणीभूत ठरणे किंवा महत्त्वाची माहिती दडवून ठेवणे, इत्यादींचा समावेश होतो. 

या सर्व विश्लेषणानंतर समोर येणारे निष्कर्ष आश्चर्यकारक असून, बंडखोरीच्या आदर्शवादाची निर्मिती म्हणजे ठिणगी असल्याचे त्यातून स्पष्ट होते. संपर्काची साधने ही सुकलेल्या जंगलात वणवा पसरवण्याची काम करत असतात. प्रत्यक्षात बंडखोरीचा वणवा अपमाहितीचे निर्माते आणि प्राप्तकर्ते यांच्यामुळे पसरतो असे नव्हे तर तो पसरतो संदेशदूतांमुळे. कारण लोकांचे वर्तन हे परिस्थितीनुरूप असते.

दूतांच्या या संदेशांच्या देवाणघेवाणीमुळे निष्कलंक आणि प्रतिबंधित माहितीचा महापूर पसरत जातो आणि त्यामुळे या दूतांवरच तांत्रिकदृष्ट्या मर्यादा आणणे गरजेचे झाले आहे. याचा आपण पुढीलप्रमाणे विचार करू या. 

तंत्रज्ञानाच्या साह्याने योजले जाऊ शकणारे उपाय

मानसशास्त्रीय दृष्टिकोनातून बंडखोरी आणि कट्टरतावाद यांच्या उद्रेकातूनच अस्तित्वाची भीती निर्माण होते. यामागे जटील अशा सामाजिक-आर्थिक घटकांचा समावेश असतो, ज्यामुळे व्यक्ती वा लोकसमूह यांच्या जीवनात अनंत अडचणी निर्माण होण्याची शक्यता असते. केवळ तंत्रज्ञानातील प्रगती या लोकसमूहांसाठी उपयुक्त ठरू शकत नाही. तंत्रज्ञानातील प्रगती केवळ जागतिक रोजगार बाजारातील गरजांच्या हालचालींपुरताच मर्यादित असल्याचे आतापर्यंत आढळून आले आहे. कट्टरतावाद समूळ उखडून काढायचा असेल तर या गंभीर अडचणींचे समूळ उच्चाटन केले जाणे महत्त्वाचे आहे. 

तथापि, या ज्या सामाजिक-आर्थिक अडचणी आहे त्या एकवेळ बाजूला ठेवून, या अरिष्टाला तंत्रज्ञानाच्या साह्याने कसा प्रतिबंध घालता येईल, याचा शुद्ध विचार केला जाणे गरजेचे आहे. कारण हेच (तंत्रज्ञानाधारित) उपाय अगदी स्पष्ट आणि कृती करण्याजोगे आहेत. 

आपण पुन्हा एकदा वक्तृत्वावर लक्ष केंद्रित करू या. बंडखोर वक्तव्यांच्या मुक्त संचाराला आळा कसा घालायचा, हा मुख्य आणि महत्त्वाचा प्रश्न आहे. या ठिकाणी दूत – अतिशय असुरक्षित रितीने वावरणारे माध्यम – हाच मोठा अडसर आहे. यावर अगदी साधासोपा उपाय म्हणजे सर्व तोंडी संवादाचे प्रस्तुतीकरण मिकी माऊसच्या पद्धतीने केले जावे. यातून विखारी मौखिक प्रचाराचा जनमानसावर होणा-या परिणामाला आळा बसेल, अशी आम्हाला आशा आहे. कारण ती नीरस-कंटाळवाणी आणि परिणामशून्य होतील. मात्र, वास्तवात हा काही स्वीकारार्ह तोडगा नाही. त्यापेक्षा अधिक वास्तववादी (आणि सर्वांना स्वीकारार्ह ठरू शकणारी) तंत्रज्ञानाची जंत्री पुढे देत आहोत. 

उच्चार/भाषण ओळखणे

ध्वनिमुद्रित केलेल्या भाषणाचा उतारा ओळखणे याचा या तंत्रज्ञानात समावेश होतो. अगदी ऐनवेळी केलेले मुक्त भाषण आणि तारस्वरात केलेले भाषण याबाबत अद्याप तरी तोडगा आढळलेला नाही परंतु स्वयंचलित भाषण ओळख यंत्रणा (ऍटोमॅटिक स्पीच रेकग्निशन सिस्टीम) या दिशेने झपाट्याने प्रगती करत आहे. ध्वनिमुद्रित केलेल्या भाषणाच्या उता-यावरून विविध पातळ्यांवरील वस्तुस्थिती शोधनासाठीचा (फॅक्ट चेकिंग) डेटाबेस तयार करता येऊ शकतो. एकदा का भाषण लिखित स्वरूपात रुपांतरित झाले की, मग इतर शक्तिशाली नैसर्गिक भाषा प्रक्रिया आणि नैसर्गिक भाषा समज तंत्रज्ञान हे मजकुराच्या योग्य हाताळणीसाठी उपयुक्त ठरू लागतील.

वक्त्याची पडताळणी आणि ओळख

अतिशय काळजीपूर्वक राखण केलेल्या व्हॉइसप्रिंट डेटाबेसशी मेळ खाणा-या व्हॉइसप्रिंटवर वक्ता पडताळणी आणि ओळख तंत्रज्ञान आधारलेले आहे. वक्ता पडताळणीमध्ये सुरुवातीला वक्त्याची ओळख दिली जाते आणि आवाज मिळताजुळता आहे किंवा कसे याद्वारे दाव्याची सत्यासत्यता तपासली जाते. वक्ता ओळख प्रक्रियेमध्ये वक्त्याची ओळख उघड केली जात नाही आणि डेटाबेसमध्ये असलेल्या व्हॉइसप्रिंटशी तो मेळ खातो का, याद्वारे त्याची तपासणी केली जाते. मशिननिर्मित अपसादरीकरण आणि मानवी आवाज (खोट्या स्रोतांकडून होणारा प्रोपगंडा) यांवर या तंत्रज्ञानांच्या साह्याने लक्ष ठेवता येते.

भाषण वैश्विकता

बहुभाषाविज्ञान हा शब्द बहुभाषा (किंवा गायन) यावरून आला आहे. बोलल्या जाणा-या संवादावर जे त्या बोलल्या गेलेल्या शब्दाची पात्रता ठरवतात किंवा त्याचा अर्थ बदलतात, वा त्यातून भावना पोहोचविल्या जातात किंवा ज्यातून वक्त्याच्या मनातील भाव श्रोत्यांपर्यंत अलगद पोहोचतात, आधारलेल्या दृष्टिकोनांचा त्यात समावेश असतो. मात्र, अचूकतेच्या बाबतीत या तंत्रज्ञानांना काही एक मर्यादा आहेत कारण त्यात मानवाकडून शिकलेल्या डेटांचा वापर केला जातो. 

आवाजाचे लक्षवेधीकरण (व्हॉइस प्रोफायलिंग)

वक्त्याविषयी भरपूर माहिती काढण्यासाठी लक्षवेधीकरणामध्ये मानवी आवाजाचे विश्लेषण केले जाते. माणसाचा आवाज हा एक शक्तिशाली बायो-पॅरामेट्रिक निदर्शक आहे. त्यात वक्त्याच्या विद्यमान (आवाजाचे ध्वनिमुद्रण सुरू असते तेव्हा) शारीरिक, मानसशास्त्रीय, लोकसंख्याशास्त्रीय, सामाजिक, वैद्यकीय आणि इतर वैशिष्ट्यांच्या माहितीचा तसेच वक्त्याच्या भवतालाचा समावेश असतो.

व्हॉइस प्रोफायलिंग तंत्रज्ञानातून आपल्याला त्या आवाजाच्या दृष्टिकोनांची माहितीही प्राप्त होते ज्याची नंतर प्रस्तुती बदलता येते. या बदलामध्ये त्या आवाजाच्या गुणवत्तेवर कोणताही परिणाम होऊ दिला जात नाही. या तंत्रज्ञानाने आपल्याला कदाचित कावेबाजपणे मिकी माऊसच्या आवाजासारखा तोडगा अंमलात आणण्यात मदत होऊ शकते. त्यातून तो आवाज काढणा-याचा आत्मविश्वास, नियंत्रण आणि गुणवत्ता या आवाजाशी संबंधित गुणांवर मात करून त्याचे कमी परिणाम होतील, असे प्रस्तुतीकरण करता येऊ शकते. 

समारोप

एखाद्या संदेशात भावना भडकिवण्याइतपत मजकूर आहे किंवा कसे याची तपासणी करण्यासाठी आवाज प्रक्षेपित करण्याच्या स्रोतांचे (चॅनेल्स) विश्लेषण केले जायला हवे. अशा आवाजांचा सातत्याने अभ्यास व्हायला हवा आणि आवाज तंत्रज्ञानासंदर्भातील सर्व कायदे त्यास लागू व्हायला हवे. जे स्रोत मोठ्या प्रमाणात ध्वनिविषयक कार्यक्रम प्रसृत करतात त्या सर्व स्रोतांना कायद्याच्या कक्षेत आणून त्यांच्याद्वारे नियंत्रित पद्धतीने भाषणे प्रसारित होतील, याची काळजी घेतली गेली पाहिजे. तरच आपला हेतू साध्य होईल असे प्रकर्षाने वाटते.

The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.