கூகுளில் அதிகம் பேர் அதிகமாக தேடுவது ‘எதை’ ? உங்கள் கணிப்பை உறுதியாக்கும் ‘பளீர்’ டேட்டா!

பிக் டேட்டா சொல்லும் பாட்டி…

‘‘இந்த உலகத்தில் எல்லோரும் எல்லோரிடமும் பொய் சொல்கிறார்கள்…”

இப்படி ஒருவர் சொன்னால், கொஞ்சம் பகீரென்றுதானே இருக்கிறது. ‘‘நீங்கள் அதிர்ச்சி அடைய வேண்டும் என்பதற்காக நான் இதை சொல்லவில்லை. புள்ளிவிவரங்களுடன் சொல்கிறேன்’’ என்கிற பீடிகையுடன் நம்முடன் பேச ஆரம்பிக்கிறார் அமெரிக்காவின் பிரபல பத்திரிகையான நியூயார்க் டைம்ஸ் பத்திரிகையின் கட்டுரையாளர், தி வார்ட்டன் ஸ்கூலின் வருகைதரு பேராசிரியரான சேத் ஸ்டீஃபென்ஸ்-டேவிடோவிட்ஸ் (Seth Stephens-Davidowitz).

Seth Stephens-Davidowitz

இவர், சில ஆண்டுகள் கூகுள் நிறுவனத்தில் `டேட்டா சைண்டிஸ்ட்’ ஆக வேலை பார்த்தவர்; இவர் எழுதிய ‘எவ்ரிபடி லைஸ் – வாட் தி இன்டர்நெட் கேன் டெல் அஸ் அபெளட் ஹு வீ ரியலி ஆர்’ (Everybody Lies: What The Internet Can Tell Us About Who We Really Are) என்கிற புத்தகம் இப்போது புத்தகவாசிகளிடம் படுபிரபலம்.

இந்தப் புத்தகம் நியூயார்க் டைம்ஸின் பெஸ்ட் செல்லர் பட்டியலில் இடம்பெற்றதோடு தி எகானமிஸ்ட், நியூ ஸ்டேட்ஸ்மேன் ஆகிய பத்திரிகைகளின் `புக் ஆஃப் தி இயர்’ ஆகவும் தெரிவு செய்யப்பட்டது.

தகவல் தொழில்நுட்பத் துறையில் சமீப காலமாக மிகவும் பிரபலமாகிவரும் துறை `பிக் டேட்டா’. பல `டெரா பைட்ஸ்’ அளவுள்ள தரவுகளைப் அக்குவேறு ஆணி வேறாகப் பகுப்பாய்வு செய்து அதன் அடிப்படையில் முக்கியமான முடிவுகளை எடுப்பதாகும். இந்த ‘பிக் டேட்டா’ இந்த அந்தத் துறையில்தான் என்றில்லை; அனைத்துத் துறைகளுக்கும் பொருந்தும்.

எல்லோரும் பொய் சொல்கிறார்கள்…

இந்தப் புத்தகம் மூன்று பகுதிகளைக் கொண்டிருக்கிறது. முதல் பகுதி, சிறிய மற்றும் பெரிய தரவுகள் குறித்த அறிமுகத்தைக் கொடுக்கிறது. ஒரு வீட்டில் பையனுக்கு எப்படிப்பட்ட பெண் பார்ப்பது என்பது குறித்து ஒவ்வொருவரும் ஒவ்வொன்று சொல்கிறார்கள். அனைத்தையும் கேட்டுவிட்டு பையனின் 88 வயதான பாட்டி, `அவனுக்கு நல்ல, ஸ்மார்ட்டான, அனைவருடனும் அனுசரித்துப் போகக்கூடிய, நகைச்சுவை உணர்வு கொண்ட பெண்தான் பொருத்தமாக இருப்பாள்’ எனக் கூற அனைவரும் ஆர்வத்துடனும் கவனத்துடனும் கேட்கிறார்கள். இதற்குக் காரணம், அவரது அனுபவம் என்கிற `பிக் டேட்டா’ ஆகும்.

Everybody Lies

இரண்டாவது பகுதி, பிக் டேட்டாவுக்கு இருக்கும் ஆற்றல் பற்றி பேசுகிறது. எண்கள் மட்டுந்தான் தரவுகளாக இருக்க வேண்டுமென்ற அவசியமில்லை. பந்தயக் குதிரைகளுக்கான ஏலம் நடக்கும்போது குதிரையின் இனம், வயது, உயரம், எடை ஆகிய உடல் சம்பந்தமான விஷயங்களும் தரவுகளாகப் பயன்படுகிறது என்பதை ஆசிரியர் உதாரணம் மூலம் விளக்கியிருக்கிறார். இது போல வார்த்தைகள், படங்கள் என அனைத்துமே டேட்டாக்கள்தான் என்கிறார்.

இதே பகுதியில் பாலியல், வெறுப்பு, பாரபட்சம், இணையம், குழந்தைகளை தவறான வழியில் பயன்படுத்துவது, கருக்கலைப்பு, நண்பர்கள் பற்றி நாம் எதிர்வினை ஆற்றுவது, வாடிக்கையாளர்கள் என அனைத்து விஷயங்களிலும் உண்மை என்பது எந்த அளவுக்கு இருக்கிறது என்பது பற்றி விரிவாக பல ஆய்வுகளை மேற்கோள் காட்டி எழுதியிருக்கிறார்.

இறுதியாக, பிக் டேட்டாவை எப்படி கையாள்வது அதனுடைய ஆற்றல் என்ன, வரம்புகள் என்ன என்பதையும் கோடிட்டு காட்டியிருக்கிறார்.

மனிதர்கள் தங்களின் முக்கியமான பல விஷயங்கள் குறித்து உண்மையைச் சொல்வதற்கு பதில், பொய்யைத்தான் சொல்கிறார்கள். உதாரணமாக, எத்தனை `பெக்’ மது குடித்தேன், எத்தனை முறை ஜிம்முக்குச் செல்கிறேன், புது ஷூ வாங்க எவ்வளவு செலவழித்தேன், ஒரு புத்தகத்தைப் படிக்கிறோமோ இல்லையோ ஆனால் அது ஒரு சலிப்பு தட்டக்கூடிய புத்தகம் என சொல்வது, இது திரைப்படத்துக்கும் பொருந்தும். இப்படி மனிதர்களாகிய நாம் ஒவ்வொரு நாளும் நண்பர்களிடம், மேலதிகாரிகளிடம், குழந்தைகளிடம், பெற்றோர்களிடம், மருத்துவர்களிடம், மனைவியிடம் என அனைவரிடமும் பொய் சொல்வது மட்டுமல்லாமல் நமக்கு நாமேயும் பொய் சொல்லிக் கொள்கிறோம்.

Google | கூகுள்

மக்களின் கருத்துகளை அறிய நடத்தும் ஆய்வுகளில் பெரும்பாலனவர்கள் தங்களைக் கீழாகவோ, ஒன்றும் தெரியாதவர்களாகவோக் காட்டிக்கொள்ள விரும்புவதில்லை. இது மனித இயல்பு. என்னதான் ஆய்வு முடிவுகளில் தனிப்பட்ட நபர்களின் பெயர்கள் குறிப்பிடப்படாவிட்டாலும் கூட மக்களின் மனப்போக்கு இப்படியாகத்தான் இருக்கிறது. இதை `சமூக விருப்பச் சார்பு (social desirability bias)’ என அழைக்கிறார்.

1950-ஆம் ஆண்டு அமெரிக்காவில் டென்வர் நகர மக்களின் மனப்போக்குக் குறித்து ஆய்வாளர்கள் அரசுத் தரப்பிலிருந்து தரவுகளைச் சேகரித்தனர். இது எத்தனை சதவிகித மக்கள் வாக்கு அளித்தனர், எவ்வளவு பேர் தொண்டு நிறுவனங்களுக்கு நன்கொடைக் கொடுத்தார்கள், நூலக அட்டை எத்தனை பேரிடம் இருக்கிறது என்பது போன்ற தகவல்களைக் கொண்ட தரவுகள் ஆகும். இந்தத் தரவுகளைச் சேகரித்தபின், நேரடியாக மக்களைச் சந்திந்து இதே தகவல்களைச் சேகரிக்கும்போது அரசுத் தரப்பிலிருந்து பெற்ற தகவல்களுக்கும் நேரடியாக கள ஆய்வு செய்து சேகரித்தத் தகவல்களுக்கும் மிகப் பெரிய வேறுபாடு இருந்தது.

கடந்த 70 ஆண்டுகளில் இந்தப் போக்கில் ஏதாவது மாற்றம் இருக்கிறதா? இல்லை என்றுதான் சொல்ல வேண்டும். ஆய்வுகளின் முடிவுகள் இப்படியிருக்கும்பட்சத்தில் ஒரு விஷயத்தின் மீது எப்படி முடிவு எடுக்க முடியும் என்பது மிகப் பெரியக் கேள்விக்குறியாகும்.

பொருளாதாரப் புத்தகங்களைப் பலரும் படிப்பதில்லை…

இந்நூலின் இறுதிப் பக்கங்களில், இந்த நூலை வாங்குபவர்களில் எத்தனை பேர் முழுமையாக வாசித்து முடிப்பார்கள் என்பதை மற்ற பிரபல எழுத்தாளர்கள் எழுதிய நூல்களை வாசித்து முடித்தவர்களின் தரவு அடிப்படையில் நிர்ணயித்திருக்கிறார். அதன்படி, பலர் முதல் 50 பக்கங்களை வாசித்து விட்டு சில கருத்துகளை மட்டும் மனதில் பதிய வைத்துக் கொண்டு அன்றாட வாழ்க்கையைப் பார்க்கச் சென்றுவிடுவார்கள் என குறிப்பிட்டிருக்கிறார்.

தாமஸ் பிக்கெட்டி!

பிரபல பொருளாதார நிபுணர் தாமஸ் பிக்கெட்டி எழுதிய `Capital in the 21st Century’ என்கிற பிரபலமான புத்தகத்தை முழுமையாக வாசித்து முடித்தவர்கள் 3 சதவீதத்துக்கும் குறைவுதான் என்கிறார். அதேசமயம், டோனா டார்ட் எழுதிய `The Goldfinch’ஐ வாசித்து முடித்தவர்கள் சுமார் 90%. . இது குறித்து இவரது முடிவு என்னவெனில், பெரும்பாலான வாசகர்கள் பொருளாதார நிபுணர்களின் நூல்களை முழுமையாக வாசித்து முடிப்பதில்லை என்பதுதான்.

கூகுள் தேடுபொறியில் செக்ஸ் பற்றி…

மனிதர்களாகிய நாம் என்ன நினைக்கிறோமோ, அதைத்தான் செய்கிறோமா என்பதைத் தெரிந்து கொள்ள முடியுமா? முடியும் என்கிறார் நூலாசிரியர். சில ஆன்லைன் ஆதாரங்கள் (sources) மக்கள் வேறு எங்கும் அல்லது யாரிடமும் சொல்லத் தயங்குகிற அல்லது ஒப்புக் கொள்ளாத விஷயங்களை ஒப்புக்கொள்ள வைக்கின்றன. இவை எண்ம உலகின் உண்மையை அறியும் நிணநீராகப் பயன்படுகின்றன (digital truth serum).

கூகுள் தேடலில் இந்தியர்களின் விருப்பம் எதில் அதிகம்?!

கூகுள் தேடுபொறியை எடுத்துக் கொள்ளுங்கள். உங்களுக்கு வேண்டியதைத் தட்டச்சு செய்யும்பட்சத்தில் அது குறித்த தகவல்களை இந்தத் தேடுபொறி சில வினாடிகளில் கொடுத்துவிடும். தகவல் தேடுபவர் தனிமையில் இதைச் செய்வதால் அவர் என்ன செய்கிறார் என யாரும் பார்ப்பதோ அல்லது யாருக்கு தெரிவதோ இல்லை. அதோடு, இது ஆன்லைன் ஆய்வும் இல்லை. இந்த மாதிரியான சூழ்நிலையில் ‘‘மனிதர்கள் இணையத்திடம் நேர்மையாகவும் உண்மையாகவும் நடந்து கொள்கிறார்கள்” என்று சொல்கிறார் இந்தப் புத்தகத்தின் ஆசிரியர்.

இந்தப் புத்தகத்தின் ஆசிரியர் கூகுள் டேட்டாக்களை நான்காண்டுகளாக ஆய்வு செய்தபோது, பலரும் அறியாத, பொதுவெளியில் இல்லாத எண்ணற்ற தகவல்களைத் தெரிந்துகொண்டு ஆச்சரியப்பட்டிருக்கிறார். அது மனநோய், மனிதர்களின் பாலின உணர்வு, கருக்கலைப்பு, மதம், ஆரோக்கியம் என பல விஷயங்கள் பற்றியதாக இருந்தது.

ஆண்கள் பெரும்பாலும் மற்ற உடல் உறுப்புகளைவிட அவர்களது பாலியல் உறுப்பு குறித்து அதிகமான கேள்விகளை தேடுபொறியில் தேடியிருக்கிறார்கள். பாலியல் குறித்த இவர்களது இரண்டாவது பொதுக் கேள்வி என்னவெனில், `உடலுறவு நேரத்தை நீடிப்பது எப்படி?” என்பதாகும். பெண்களைப் பொருத்தவரை, அவர்களது கேள்வியானது ஆண்களுக்கு ”உடலுறவின் உச்சகட்டம் எப்போது ஏற்படுகிறது என்பது பற்றியல்ல” மாறாக, ‘‘ஏன் ஏற்படுவதில்லை” என்பதுதான் என தேடுபொறி தரவுகள் மூலம் தெரிய வந்திருக்கிறது.

இது போல, வெளியில் யாரிடமும் கேட்கத் தயங்கும் கேள்விகளை தேடுபொறி மூலம் தேடுவதால் அவர்கள் இணையத்துக்கு உண்மையானவர்களாகவும் நேர்மையானவர்களாகவும் இருக்கிறார்கள்.

இது தவிர, `கறுப்பு இன மக்கள் ஏன் முரட்டுத்தனமாக இருக்கிறார்கள்?”, `யூதர்கள் ஏன் தீயவர்களாக இருக்கிறார்கள்?” என்பது போன்ற இனம், நிறம், மனப்போக்கு ஆகியவை குறித்த கேள்விகளையும் கூகுள் தரவுகளில் பார்க்க முடிகிறது என்கிறார் ஆசிரியர்.

இந்த மாதிரியான தேடு தரவுகளின் வாயிலாக ஓர் இனம் அல்லது நிறம் அல்லது மதத்தின் மீதான வெறுப்புக்குக் காரணம் என்ன என்பதைக் கண்டறிந்து அதை நீக்குவதற்கு அல்லது குறைப்பதற்கு அரசும் அரசு சார்ந்த அமைப்புகளும் நடவடிக்கைகளை மேற்கொள்ள வேண்டும்.

கொரோனா மரணம்

இந்தியச் சூழலுக்கும் பொருந்தும்…

இப்படி பல புள்ளிவிவரங்களுடன் சுவாரஸ்யமாக எழுதப்பட்டிருக்கும் இந்தப் புத்தகம் சொல்லும் ஒவ்வொரு விஷயம், நம் இந்தியச் சூழலுக்கும் நூறு சதவிகிதம் பொருந்தும். தரவுகளின் மூலம் பிரச்னைகளுக்கு வழி காண வேண்டுமெனில், முதலில் அவை குறித்து தரமான, செறிவான தகவல்களைத் திரட்டுவது முக்கியமானதாகும். இதற்கு ஓர் உதாரணம், பெருந்தொற்றில் இறந்தவர்களின் எண்ணிக்கையாகும். இந்திய அரசு கூறும் தகவலுக்கும் உலகச் சுகாதார அமைப்பு கூறுவதற்கும் இடையே இருக்கும் வித்தியாசம் சுமார் 10 மடங்காகும்.

தரவுகள் சரியாக இல்லாதபட்சத்தில் தீர்க்கமான முடிவுகளை எடுக்க முடியாது, அப்படியே எடுத்தாலும் அவை பிரச்னைகளுக்குத் தீர்வாக அமையாது என்பது என்றைக்கு நாம் சரியாகப் புரிந்துகொள்கிறோமோ, அன்றைக்குத்தான் நம்மால் சரியான முடிவுகளை எடுத்து நடைமுறைப்படுத்த முடியும் என்பதே உண்மை.

தரவுகளின் மீது ஈடுபாடு கொண்டவர்களுக்கும், ஆய்வாளர்களுக்கும், சமூகம் சார்ந்த, நிறுவனம் சார்ந்த முடிவுகளை எடுக்கும் பொறுப்பில் இருப்பவர்களுக்கும் இந்த நூல் பயனுள்ளதாக இருக்கும்!

Source link

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.