Uluslararası kategoride proje bulunamadı!
Çok Dilli Gelişmiş İlişkisel Sözlük Geliştirme ve Otomatik Türkçe WordNet Oluşturma

Özet: Bu proje kapsamında, tüm diller arası (başlangıçta Türkçe ve İngilizce) sözcük, deyim, atasözü ve çeşitli cümleleri (örn: “En iyi asimetrik şifreleme doldurması” > “Optimal asymmetric encryption padding”) çevirebilen, ayrıca sözcüklerin ilişkilerini tutabilen bir sözlük geliştirilecektir. Örneğin “ambulans” kelimesi “araba” kelimesinin direkt alt grubundadır gibi. Ayrıca çeşitli yöntemler ve algoritmalar kullanılarak (İngilizce WordNet’den faydalanmak ve Wiktionary projelerinden çözümlenecek yapılandırılmış veri gibi) Türkçe bir WordNet (SözcükAğı) oluşturulmaya çalışılacaktır. Dahası, sözcüklerin her dilde cümle içinde kullanımlarına örnekler ve sözcüklere dair Wikipedia ve Wiktionary açıklamaları da kullanıcılara gösterilecektir. Türkçe WordNet oluşturmak için literatürde çeşitli çalışmalar yapılmış olmasına rağmen [1-11], bu proje kapsamında daha kapsamlı ve kullanışlı bir Türkçe WordNet oluşturulmaya çalışılacaktır. İlk olarak kullanıcı sorgularını çok yüksek performans ile karşılayabilecek, sözcükler arası ilişkileri tutabilecek gelişmiş bir sözlük veri tabanı tasarlanacaktır. Veri tabanı tasarımına senkronize olarak, çok çeşitli ücretsiz ve açık kaynak sözcük veri tabanlarını (örneğin: İngilizce WordNet dosyaları, Wiktionary.org exported veri tabanları, Babylon Glossary dosyaları, özel yazılmış SQL dosyaları, text dosyaları, .dic ve .aff dosyaları, vb.) işleyebilecek bir yazılım geliştirmesi yapılacaktır. Tüm diller için bütün fiil çekimleri ve sözlükte olan kelimeler, bahsedilen çevrimdışı dosyalar ve geliştirilecek kelime işleme kuralları ile veri tabanına eklenecektir. Daha sonra online kaynakları tarayıp sözcükler arası ilişkileri, çevirileri, sözcüklerin cümleler içinde kullanım örneklerini ve sözcüklerin açıklamalarını bulabilecek web tarayıcı yazılımları geliştirilecektir. Bu yazılımlar ile TDK, Google Translate, Yandex Translate, Wikipedia, Wiktionary gibi çeşitli web siteleri taranacak ve veri toplama işlemi yapılacaktır. En son bütün dillerin sahip oldukları tüm kelimelerin (fiil çekimleri dâhil örneğin koşuyorum gibi) çevirilerini ve sözcükler arası ilişkilerini beraber içeren veri tabanı tamamlandıktan sonra, Türkçe WordNet oluşturmak için algoritma araştırma ve geliştirilmesi yapılacaktır. Tüm veri tabanı işlemleri bittikten sonra ise kullanıcıların geliştirilen sözlüğü kullanabileceği arka-plan ve ön-yüz (mobil uyumlu ve AMP projesini destekleyen web sitesi) yazılımları geliştirilecektir. Geliştirme süreci Dr. Öğr. Üyesi Furkan GÖZÜKARA tarafından, proje kapsamında istenilen bilgisayar sistemi ve Toros Üniversitesinin sağladığı altyapı imkânları ile yürütülecektir. Proje sonunda akademik camianın, öğrencilerin ve sözlük ihtiyacı duyan herkesin kullanabileceği çok gelişmiş bir Türkçe WordNet ve sözlük web sitesi çıktı olarak hedeflenmektedir. Elde edilecek Türkçe WordNet’in, SCI-Expanded bir dergide yayın yapılarak herkese açık kaynak olarak yayınlanması amaçlanmaktadır.

02.09.2021 – 31.08.2023 FURKAN GÖZÜKARA

Beklemede Yükseköğretim Kurumları tarafından destekli bilimsel araştırma projesi Yürütücü

Diğer kategoride proje bulunamadı!