பழமையான எழுத்தும் நவீன pattern recognition-உம் சந்திக்கின்றன
ஹித்தைட் ஆய்வுகளில் ஒரு reported machine learning breakthrough, மனிதவியல் துறையில் ஏஐ பயன்படுத்தப்படும் விதத்தில் ஒரு பெரிய மாற்றத்தைக் குறிக்கிறது. Interesting Engineering இலிருந்து வழங்கப்பட்ட candidate metadata மற்றும் excerpt படி, கணினி மொழியியலாளர்கள் மற்றும் தொல்லியலாளர்கள் கொண்ட ஒரு குழு 3,500 ஆண்டுகள் பழமையான ஹித்தைட் எழுத்தை 90% துல்லியத்துடன் decipher செய்யக்கூடிய ஒரு digital system-ஐ உருவாக்கியுள்ளது.
வரம்பான source detail இருந்தாலும், மையக் கோரிக்கை முக்கியமானது. ஹித்தைட் உரைகள் பண்டைய Near East-இன் அடிப்படை archive-களில் ஒன்றில் இடம்பெறுகின்றன, ஆனால் சேதமடைந்த அல்லது கடினமான inscriptions-ஐ வாசிப்பது, வகைப்படுத்துவது, மற்றும் மீளமைப்பது மிகவும் உழைப்பான வேலை. உயர்ந்த துல்லியத்தில் உதவக்கூடிய ஒரு system, நிபுணர் விளக்கத்தை மாற்றாது; ஆனால் வரலாற்றுப் பகுப்பாய்வில் மிக நேரம் பிடிக்கும் பகுதிகளில் ஒன்றை கணிசமாக வேகப்படுத்தும்.
90% என்ற எண்ணிக்கை ஏன் முக்கியம்
அறிக்கையிடப்பட்ட துல்லிய நிலை, தொல்லியல் மற்றும் ஏஐ research இரண்டிலும் கவனத்தை ஈர்க்கும் அளவுக்கு உயர்ந்தது. நடைமுறையில், இத்தகைய tools முழுத் துறையையும் தீர்க்கின்றன என்பதனால் அல்ல; நிபுணர்களின் கைமுறைச் சுமையை குறைக்க முடியும் என்பதால்தான் மதிப்புடையவை. ஒரு model வலுவான candidate readings வழங்கி, மீண்டும் வரும் patterns-ஐ அடையாளம் கண்டு, அல்லது transcription workflows-ஐ standardize செய்ய உதவுமானால், machines இன்னும் சிரமப்படும் கடினமான interpretive பணிக்கான நேரம் researchers-க்கு கிடைக்கும்.
அது scale-ஐயும் மாற்றுகிறது. பண்டைய மொழி scholarship பெரும்பாலும் expert time, fragment condition, மற்றும் மீண்டும் மீண்டும் review தேவைப்படுவதால் கட்டுப்படுகிறது. ஒரு digital system, மனித அணியால் தனியாக கையாள முடிவதை விட அதிகமான material-ஐ process செய்யக்கூடும், குறிப்பாக inscriptions பலவாக இருந்தால், பகுதியாக பாதுகாக்கப்பட்டிருந்தால், அல்லது collections-இல் பரவியிருந்தால்.
அறிவியலில் ஏஐ பற்றி இது சொல்வது
அறிக்கையிடப்பட்ட ஹித்தைட் முடிவு ஒரு பரவலான trend-ஐ பொருந்துகிறது: ஏஐ consumer-facing novelty-இலிருந்து domain-specific research infrastructure-க்குப் போகிறது. science மற்றும் engineering-இல், அது பெரும்பாலும் modeling, simulation, அல்லது automation கருவிகளை意味க்கும். மனிதவியல் துறையில், அது transcription, restoration assistance, corpus analysis, மற்றும் பெரிய text மற்றும் image bodies முழுவதும் pattern discovery என்பவற்றை அதிகமாக குறிக்கிறது.
முக்கியமான வேறுபாடு என்னவென்றால், வரலாற்று research-ஐ raw prediction-ஆக மட்டும் சுருக்க முடியாது. ஒரு model, probable reading ஒன்றை வழங்கலாம்; ஆனால் context, grammar, chronology, மற்றும் material evidence இன்னும் முக்கியமானவை. அதனால் human oversight மையமாகவே உள்ளது. உண்மையான வாக்குறுதி experts மற்றும் software இடையிலான collaboration-இல்தான் உள்ளது; ஒன்றை மற்றொன்றால் மாற்றுவதில் அல்ல.
விளக்கத்திலிருந்து அணுகலுக்கு
இத்தகைய systems தொடர்ந்து மேம்பட்டால், அதன் மிகப்பெரிய நீண்டகால தாக்கம் access ஆக இருக்கலாம். மேலும் texts digitize செய்யப்படலாம், மேலும் inscriptions searchable ஆகலாம், மற்றும் முன்பு மிகக் கடினமாக அல்லது மிக மெதுவாக process செய்ய வேண்டிய ancient corpora-வுடன் மேலும் research groups வேலை செய்ய முடியும். மாணவர்களுக்கும் அறிஞர்களுக்கும், இது மிகத் துல்லியமான துறைகளில் நுழைவு தடையை குறைக்கக்கூடும்.
இது preservation workflows-ஐயும் மேம்படுத்தலாம். digital-assisted reading tools, institutions-க்கு artifacts-ஐ மேலும் ஒற்றுமையாக document செய்யவும், எதிர்கால ஆய்வுக்காக மேலும் பயனுள்ள archives உருவாக்கவும் உதவக்கூடும். material damage மற்றும் data scarcity எப்போதும் கவலைக்குரிய துறைகளில், better digital handling itself ஒரு அர்த்தமுள்ள முன்னேற்றம்.
நிச்சயமாக சொல்லக்கூடியது
- வழங்கப்பட்ட metadata, கணினி மொழியியலாளர்கள் மற்றும் தொல்லியலாளர்களால் உருவாக்கப்பட்ட machine learning system-ஐ விவரிக்கிறது.
- அந்த system, 3,500 ஆண்டுகள் பழமையான ஹித்தைட் எழுத்தை இலக்காகக் கொண்டதாக சொல்லப்படுகிறது.
- அறிக்கையிடப்பட்ட செயல்திறன் நிலை 90% துல்லியம்.
இந்த விவரங்கள் மட்டுமே ஏஐ-உதவிய scholarship எங்கே செல்லுகிறது என்பதைச் சுட்டிக்காட்டும் முக்கிய அறிகுறியாக இந்தக் கதையை மாற்றத் தக்கவை. அறிக்கையிடப்பட்ட செயல்திறன், முழுமையான வெளியீடு அல்லது technical disclosure-இல் உறுதிப்படுத்தப்பட்டால், அது digital archaeology மற்றும் computational linguistics இரண்டிற்கும் குறிப்பிடத்தக்க முன்னேற்றமாக இருக்கும்.
இந்தக் கட்டுரை Interesting Engineering வெளியிட்ட செய்தியை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.
Originally published on interestingengineering.com

