Pismo klinowe jest jednym z najwcześniejszych systemów pisma w historii ludzkości (ok. 3400 p.n.e.–75 n.e.). W ciągu ostatnich dwóch stuleci odnaleziono setki tysięcy takich tekstów, z których większość jest napisana w języku sumeryjskim i akadyjskim. Okazuje się, że do odczytania tego trudnego dla współczesnych ludzi rodzaju pisma można wykorzystać sztuczną inteligencję.  

Na południu Mezopotamii, pod koniec 4 tysiąclecia p.n.e., opracowano system pisma oparty na ideogramach, który początkowo służył do prowadzenia „ksiąg” rachunkowych. Teksty były pisane na glinie i zawierały imiona osobiste oraz listy towarów. Tak więc identyfikacja języka stojącego za tymi ideogramami jest bardzo problematyczna. Pierwsze zrozumiałe teksty pochodzą z Ur i są datowane na 28 wiek przed naszą erą. Są one niewątpliwie napisane w języku sumeryjskim. Już w tych tekstach pojawia się semickie imię, najprawdopodobniej akadyjskie. Wskazuje to na współistnienie tych dwóch społeczności językowych od niemal początku pisanej historii Mezopotamii. Pismo klinowe wraz z językiem akadyjskim rozprzestrzeniły się w całej Mezopotamii i stały się dominujące na starożytnym Bliskim Wschodzie aż do pierwszego tysiąclecia p.n.e., kiedy to zostały stopniowo zastąpione przez język aramejski i jego pismo alfabetyczne.

Sumeryjski, język aglutynacyjny, był używany od drugiej połowy czwartego tysiąclecia p.n.e. do końca kultury pisma klinowego, a także czasów wspólnych, kiedy znajdujemy tak zwane Graeco-Babyloniaca, czyli sumeryjskie greckie transliteracje. Po połowie drugiego tysiąclecia p.n.e. sumeryjski był już jednak językiem martwym, używanym głównie w formie pisemnej. Od połowy drugiego tysiąclecia p.n.e. zaczął dominować język akadyjski. Niemniej jednak uczeni akadyjscy nadal studiowali język sumeryjski poprzez teksty gramatyczne, kompozycje dwujęzyczne, listy leksykalne i teksty szkolne. Akadyjski, należący do wschodniej gałęzi rodziny języków semickich, był używany głównie na północy Mezopotamii. Jest to jeden z najpowszechniejszych języków starożytności, porównywalny z łaciną. Nie tylko sumeryjski i akadyjski używały pisma klinowego, ale także hetycki, hurycki, elamicki, ugarycki i kilka innych mniej powszechnych języków na starożytnego Bliskiego Wschodu. Ostatnie znane dokumenty pisane w języku akadyjskim pochodzą z pierwszego wieku naszej ery, ale jako język mówiony zniknął wieki wcześniej.

Setki tysięcy glinianych tabliczek zapisanych pismem klinowym dokumentują polityczną, społeczną, gospodarczą i naukową historię starożytnej Mezopotamii. Większość jednak tych dokumentów pozostaje nieprzetłumaczona i niedostępna ze względu na ich ogromną liczbę i ograniczoną liczbę ekspertów zdolnych do ich odczytania. System pisma klinowego, od jego początków około 3400 r. p.n.e. do końca jego użytkowania, zawiera około 1000 znaków. Niemniej jednak nie wszystkie te znaki były używane razem w tym samym okresie. Różniły się one w zależności od okresu, gatunku itp. Poza tym kształt znaków zmieniał się w zależności od lokalizacji oraz w czasie. Mezopotamskie znaki klinowe są ponadto poliwalentne, co oznacza, że istnieje więcej niż jeden sposób odczytywania każdego znaku.

Zespół izraelskich naukowców opracował oprogramowanie, które potrafi tłumaczyć pismo klinowe na język angielski. Wyniki swoich badań opisali w artykule, który ukazał się w maju 2023 roku w prestiżowym piśmie „PNAS Nexus” wydawanym przez The National Academy of Sciences (Narodową Akademię Nauk). Oprogramowanie wykorzystuje metody przetwarzania języka naturalnego, takie jak konwolucyjne sieci neuronowe (CNN), do automatycznego tłumaczenia języka akadyjskiego z glifów klinowych bezpośrednio na język angielski i z transliteracji na język angielski. To kolejny ważny krok w kierunku zachowania i rozpowszechniania dziedzictwa kulturowego starożytnej Mezopotamii.

Tłumaczenie jest złożonym procesem, ponieważ zwykle wymaga nie tylko specjalistycznej wiedzy na temat dwóch różnych języków, ale także różnych środowisk kulturowych. Narzędzia cyfrowe, które mogą pomóc w tłumaczeniu, stają się coraz bardziej rozpowszechnione, wraz z postępem w takich dziedzinach, jak optyczne rozpoznawanie znaków i tłumaczenie maszynowe. Starożytne języki wciąż jednak stanowią ogromny problem. Ich odczytanie i zrozumienie wymaga wiedzy o dawno wymarłej społeczności językowej, a ponadto same teksty mogą być bardzo fragmentaryczne.

Izraelscy naukowcy podjęli się pierwszego tłumaczenia maszynowego języka akadyjskiego, jednego z najstarszych, ale lepiej poświadczonych języków starożytnych (ok. 2700 p.n.e.–75 n.e.). Biorąc pod uwagę, że akadyjski jest językiem martwym, a jego forma ustna nie została zapisana, opierali się wyłącznie na jego formie pisemnej. Ich źródło pochodziło z asyryjskich i babilońskich dialektów akadyjskiego.

Wiązało się to oczywiście z wieloma wyzwaniami. Przede wszystkim gliniane tabliczki rzadko są całkowicie zachowane, co czasami wpływa na brak kontekstu. Kolejnym wyzwaniem jest złożona logofonetyczna natura pisma klinowego, to oznacza, że znaki mogą pełnić jedną z trzech funkcji – mogą być logogramami, determinatywami i fonogramami/sylabogramami. Dlatego znaki pisma klinowego są wielowartościowe i mają kilka odczytów dla każdej funkcji. Na przykład znak graficzny „UD”, pierwotnie piktogram Słońca (boga), ma ponad 17 wartości fonetycznych i 6 logograficznych, które można poprawnie odczytać tylko w kontekście. Czasami nawet eksperci nie są w stanie określić właściwej wartości znaku. Specjaliści nie tłumaczą bezpośrednio starożytnych znaków pisma klinowego na współczesny język. Najpierw oceniają kontekst każdego znaku w danej sekwencji – proces ten nazywany jest transliteracją, co skutkuje transkrypcją znaków pisma klinowego na alfabet łaciński. Tak więc praca składa się z dwóch etapów: najpierw transliteracja, a dopiero potem tłumaczenie. Pierwszy etap może obejmować również segmentację słów, ponieważ pismo klinowe praktycznie nie zawiera żadnych znaków interpunkcyjnych. 

Inną kwestią, którą należy wziąć pod uwagę podczas tłumaczenia akadyjskiego, są różne style każdego gatunku tekstu. Im bardziej sformalizowany jest gatunek źródła, tym dokładniejsze będzie tłumaczenie. Przykładowo teksty administracyjne i wróżbiarskie mają tendencję do bycia bardzo sformalizowanymi. Ponadto teksty w języku akadyjskim rzadko są pisane całkowicie sylabicznie i prawie wszystkie z nich używają sumeryjskich logogramów. Niektóre gatunki, takie jak teksty wróżbiarskie, obficie wykorzystują logogramy, a wiele zdań składa się wyłącznie z logogramów. Często nazwy osób, miejsc i świątyń są same w sobie złożonymi zdaniami zapisanymi za pomocą logogramów.

Do tłumaczenia tekstów akadyjskich izraelscy naukowcy wykorzystali model konwolucyjny. Konwolucyjna sieć neuronowa (CNN) jest rodzajem sztucznej sieci neuronowej powszechnie stosowanej w rozpoznawaniu i przetwarzaniu obrazów, która, jak wykazano, dobrze sprawdza się w tłumaczeniu maszynowym o niskich zasobach i na poziomie znaków. Jego zaletą jest też krótszy czas uczenia w porównaniu z innymi programami.

Opracowano na podstawie
Translating Akkadian to English with neural machine translation 

Sumeryjski kontrakt spisany pismem klinowym (ok. 2600  p.n.e.) | fot. Louvre Museum, Public domain, via Wikimedia Commons