Eine von künstlicher Intelligenz unterstützte Lösung kommt von den Akademikern unseres Landes, um die osmanischen Archive und Ressourcen, die eines der größten Probleme in den Sozialwissenschaften darstellen, in das heutige Türkisch zu übertragen. Das von İshak Dölek, einem Doktoranden an der Universität Istanbul-Cerrahpaşa, mit seinem Betreuer entwickelte Projekt wurde in das Förderprogramm TÜBİTAK 1512 aufgenommen. Das Projekt, das auch von KOSGEB unterstützt wurde, wurde mit der fertigen OCR-Anwendung in eine Initiative umgewandelt.
Die Akademiker unseres Landes übertragen osmanische Quellen mit künstlicher Intelligenz auf das heutige Türkische. Assoziierter Professor an der Abteilung für Computertechnik der Universität Istanbul-Cerrahpaşa. DR. Unter der Leitung von Atakan KURT, Dr. Die lokale Initiative Osmanlica.com, die als Promotionsprojekt von İshak DÖLEK gestartet war, erzielte einen 96-prozentigen Erfolg im osmanischen OCR-Prozess, der den ersten Schritt zur Übertragung osmanischer Quellen in das heutige Türkisch darstellt.
Sie lösen die osmanisch-türkische Übertragung in 3 Schritten: 1- OCR 2- Alphabetische Übersetzung 3- Sprachübersetzung
„Osmanlica.com: Artificial Intelligence Supported Ottoman Turkish-Turkish End-to-End Transmission“, das als Doktorarbeit begann, um alle Arten von Ressourcen in osmanischen Archiven und Bibliotheken in drei Schritten ins heutige Türkisch zu übertragen: Ottoman OCR, Ottoman -Übersetzung des türkischen Alphabets und der osmanisch-türkischen Sprachübersetzung Das Projekt wurde später von Entertech Teknokent A.Ş auf dem Avcılar-Campus durchgeführt. wurde in das Unterstützungsprogramm der Initiative TÜBİTAK 1512 aufgenommen. Unternehmer Mina ARGE Bilişim Ltd. Sti. und sie entwickelten das OCR-Projekt, das der erste Schritt des Projekts war. Nach erfolgreichem Abschluss des OCR-Projekts entwickelt die Mina ARGE mit Unterstützung von KOSGEB und TUBITAK weiterhin das Übersetzungsprojekt des osmanisch-türkischen Alphabets, das eine Fortsetzung dieses Projekts darstellt. Nachdem das Unternehmen in seinem Alphabet-Übersetzungsprojekt bereits eine Genauigkeit von 75 % erreicht hat, setzt es seine F&E-Aktivitäten mit einer Gruppe von Computer-, Sprach-, Literatur- und Historikern fort, um in dieser Anwendung eine Genauigkeit von 95 % zu erreichen.
96 % Erfolg bei osmanischer OCR erzielt
Assoz. DR. Atakan KURT gab folgende Erklärung ab: „Es gibt Hunderttausende von osmanischen Büchern, Zeitungen, Zeitschriften und Dokumenten in Staatsarchiven, Bibliotheken und Privatsammlungen im In- und Ausland. Es ist praktisch unmöglich, so viele Dokumente manuell von Menschenhand ins Türkische zu übersetzen. In letzter Zeit wurden große Fortschritte in den Informationstechnologien und der künstlichen Intelligenz erzielt. Auf diese Weise können Probleme, die bisher nicht gelöst werden konnten, im Lichte neuer Entwicklungen gelöst werden. Wir passen diese neuen Technologien an, um die Dokumente in osmanischen Archiven und Bibliotheken ins heutige Türkisch zu übertragen. Wir haben bedeutende Erfolge in den Phasen OCR und Transliteration erzielt. Dieses in den westlichen Ländern weitgehend gelöste Problem ist in unserem Land noch nicht gelöst. Unser Ziel ist es, Bücher, Zeitschriften, Zeitungen und Archivdokumente aus dem Osmanischen Türkisch in das heutige Türkisch zu übersetzen, damit sie von einfachen Menschen und insbesondere von der neuen Generation gelesen und verstanden werden können; und die notwendige Software zu entwickeln, um die Geschichte zu beleuchten, indem Dokumente entdeckt werden, die vielleicht noch nie untersucht oder gelesen wurden. Unserer Meinung nach ist dieses Projekt ein Anwärter darauf, das Visionsprojekt der Türkei in den Sozialwissenschaften zu werden. Mit diesem Projekt können hunderttausende Bücher, Zeitschriften, Zeitungen und Millionen von Archivdokumenten schnell ins heutige Türkisch übersetzt werden.“
Bei der Übersetzung des osmanisch-türkischen Alphabets wurde eine Genauigkeitsrate von 75 % erreicht
Dr. İshak DÖLEK hingegen sagte, dass „zusätzlich zum osmanischen OCR-Prozess die Arbeit an anderen Projekten wie der Übersetzung des osmanischen Alphabets ins Türkische, der Sprachübersetzung vom Osmanischen ins zeitgenössische Türkisch und der Rika-OCR fortgesetzt wird Umwandlung der osmanischen Handschrift von Bild in Text mit OCR.“ „Zum Beispiel haben wir eine Genauigkeitsrate von 75 % bei der Übersetzung eines osmanischen Textes aus dem auf Arabisch basierenden osmanischen Alphabet in ein auf Latein basierendes türkisches Alphabet erreicht. Unsere Alphabet-Übersetzungsanwendung ist immer noch die einzige Anwendung, die Dienste im Internet bereitstellt.“
Sie testeten die alphabetische Übersetzung mit einem Datensatz von 3.000 Wörtern und 23.000 Buchstaben
DR. İshak DÖLEK fuhr mit seiner Aussage fort: „Wir haben 96 Prozent Erfolg in der OCR-Anwendung erzielt, die mit einem originalen osmanischen Datensatz getestet wurde, der aus 21 Seiten, 3.000 Wörtern und 23.000 Buchstaben in osmanischer Nesih-Linie besteht. Mit anderen Worten, 96 von 100 Buchstaben wurden von der Anwendung richtig erkannt, was die höchste jemals erreichte Genauigkeitsrate ist. In diesen Tests haben wir unsere Anwendung mit fünf verschiedenen OCR-Anwendungen verglichen, von denen vier aus dem Ausland und eine aus der Türkei stammten, und wir haben die Ergebnisse in Form eines Papiers auf einer internationalen Konferenz und eines Artikels in einer Zeitschrift veröffentlicht. Wir freuen uns über den Beitrag, den unsere Praxis, in der wir unsere F&E-Aktivitäten fortsetzen, in den Sozialwissenschaften leisten wird. Mehr als 20.000 Benutzer haben unsere OCR-Anwendung auf Osmanlica.com ausprobiert, und mehr als 100.000 Benutzer haben unsere Alphabet-Übersetzungsanwendung bisher ausprobiert. Diese Zahlen steigen täglich weiter an. Diese Situation motiviert uns noch mehr.“