Penerjemah biasa

Menerjemahkan surat dari mitra asing atau bagian dari dokumentasi - ini dan tugas-tugas lain yang disebabkan oleh kebutuhan untuk memahami dengan cepat isi teks dalam bahasa asing, sangat sering terjadi. Saat ini, layanan terjemahan online membantu mengatasi kendala bahasa. Untuk Hari Penerjemah, yang diperingati pada tanggal 30 September, kita akan berbicara tentang teknologi yang menjadi dasar kerja layanan tersebut, mengenalnya sendiri dan mencoba memilih yang terbaik.

Teknologi

Ada dua teknologi terjemahan mesin utama: Terjemahan Mesin Berbasis Aturan (RBMT) dan Terjemahan Mesin Statistik (SMT). Yang pertama, untuk mendapatkan terjemahan, itu aturan yang diketahui bahasa, diimplementasikan dalam bentuk algoritma linguistik. Teknologi statistik tidak menggunakan algoritme seperti itu: teknologi ini secara bertahap “mempelajari” bahasa dengan membandingkan ribuan teks paralel - yaitu, teks yang berisi informasi yang sama, tetapi bahasa yang berbeda- dan memilih opsi terjemahan yang paling mungkin berdasarkan ini.

Mari kita lihat teknologi ini lebih detail.

Proses penerjemahan berbasis aturan, dapat dibagi menjadi beberapa tahap.

  • Analisis morfologi, di mana jenis kelamin, jumlah, orang, dan karakteristik morfologis kata lainnya ditunjukkan. Hal ini menimbulkan masalah polisemi: kata yang sama dapat merujuk pada jenis kata yang berbeda. Misalnya, kata “blow” dalam bahasa Inggris dapat digunakan baik sebagai kata kerja (meniup, mengipasi) dan sebagai kata benda (meniup). Pada pada tahap ini Kedua opsi terjemahan dicatat.
  • Kata-kata individual digabungkan menjadi beberapa kelompok. Misalnya, frasa "banyak huruf bagus" terdiri dari kata kuantitas jamak "banyak", kata sifat "bagus", dan kata benda jamak "huruf". Hal ini memungkinkan Anda untuk menyelesaikan masalah ambiguitas tata bahasa dan menghilangkan makna kata yang “ekstra”.
  • Mengurai kalimat, yaitu pengertian anggota-anggota kalimat dan tempatnya dalam kalimat. Pertama program mencari predikatnya. Kemudian, sebelum predikat ditemukan, dicari subjeknya. Jika tidak ada, maka algoritma mencari subjek di balik predikat. Jika subjeknya juga tidak ada, maka subjeknya dianggap tidak ada, seperti yang terjadi misalnya pada kalimat impersonal (“Mereka membawa kue”).

Koordinasi bagian-bagian kalimat yang ditemukan dan kelompok kata-kata yang bergantung - sintesis proposal.

Pendekatan terjemahan serupa digunakan dalam layanan SYSTRANet dari SYSTRAN dan Translate.Ru perusahaan Rusia PROMT.

Menggunakan aturan adalah satu-satunya cara untuk melakukan terjemahan mesin hingga tahun 2006, ketika layanan tersebut muncul Google Terjemahan, berdasarkan pendekatan penerjemahan - statistik - yang berbeda.

Untuk pekerjaanmu sistem terjemahan statistik membutuhkan database teks paralel yang luas. Sumber teks tersebut dapat berupa versi multibahasa dari situs web organisasi, misalnya database dokumen UE. Pada saat yang sama, agar penerjemah dapat bekerja dengan benar, diperlukan tidak hanya dokumen paralel dalam jumlah besar, tetapi juga sejumlah besar dokumen paralel dalam database. Tidak mengherankan jika penerjemah statistik pertama yang tersedia adalah layanan ini mesin pencari terbesar- Perusahaan Google. Pesaing segera menyusul: Bing dengan Microsoft Translator dan Yandex dengan Yandex.Translation.

Secara default, SYSTRANet menawarkan terjemahan teks, halaman web, dan bekerja dengan kamus. Pengguna terdaftar juga mendapatkan akses ke terjemahan RSS feed, file, dan fungsi "Kamus sendiri". Juga gratis akun memungkinkan Anda menggunakan opsi “Terjemahan saat mengetik”, “Arti alternatif kata”, dll.

SYSTRANet juga memungkinkan Anda menerjemahkan file dalam format txt, rtf, htm. Untuk meningkatkan kualitas terjemahan, pengembang menawarkan kamus khusus pada sembilan topik. Secara total, lebih dari 35 arah terjemahan dinyatakan dalam sistem.


Penerjemah online PROMT Translate.Ru adalah yang tertua di Runet. DI DALAM saat ini Ini mendukung 9 bahasa. Translate.Ru memungkinkan Anda memilih subjek teks lebih lanjut terjemahan yang akurat. Tersedia total 16 kamus tematik (“Olahraga”, “Perjalanan”, “Komputer”, dll.). Fungsi pemeriksaan ejaan awal dan kamus didukung. Untuk melihat daftar opsi terjemahan, Anda perlu memilih kata di jendela teks sumber dan kemudian klik tombol "Kamus" pada toolbar - semua opsi yang diketahui sistem akan ditampilkan di jendela terpisah.


Jendela kamus masukMenerjemahkan. Ru


Penerjemah mesin pencari Bing didasarkan pada Microsoft Translator - layanan awan terjemahan statistik dari Microsoft. Mendukung 44 bahasa, termasuk Rusia dan Ukraina, memiliki fungsi membaca teks, mencari teks mesin pencari, menerjemahkan halaman web dan mengirim terjemahan melalui email. Batasan ukuran teks terjemahan adalah 5 ribu karakter.


Layanan terjemahan Google adalah yang paling populer di Internet. Ini mendukung 80 bahasa, termasuk Rusia, Ukraina, dan Belarusia. Ada fungsi transfer instan, ketika hasilnya ditampilkan segera setelah memasukkan teks asli. Arah terjemahan ditentukan secara otomatis. Jika Anda memasukkan tautan web ke dalam bidang terjemahan, seluruh halaman akan diterjemahkan. Anda juga dapat menerjemahkan dokumen standar format kantor dan format PDF.


Yang bermanfaat fitur Google Menerjemahkan terutama yang patut diperhatikan adalah kemampuan untuk mendapatkan terjemahan alternatif kata dan frasa individual. Selain itu, sistem memiliki input suara dan kemampuan untuk mendengarkan suara teks asli dan terjemahannya - misalnya, Anda dapat memutar suara dari tablet atau ponsel cerdas, mengingatnya, dan berkomunikasi di negara asing.

Tidak ada batasan jumlah kata dalam teks yang diproses.

Layanan terjemahan online dari Yandex muncul pada tahun 2011 dan saat ini menyediakan kemampuan untuk menerjemahkan dalam 46 bahasa, termasuk Rusia, Ukraina, dan Belarusia. Yandex.Translation bekerja dalam dua mode: terjemahan teks dan terjemahan halaman web. Untuk menerjemahkan halaman web, Anda perlu menempelkan tautan ke kolom masukan dan klik tombol “Terjemahkan”.

Dukungan layanan deteksi otomatis bahasa, fungsi terjemahan instan dan petunjuk saat mengetik (menggunakan huruf pertama, layanan mencoba menentukan kelanjutan sebuah kata, atau, dengan mempertimbangkan konteksnya, menyarankan kata berikutnya yang paling mungkin). Untuk bahasa Rusia, Inggris dan bahasa Ukraina Tersedia pemeriksaan ejaan. Anda juga dapat mendengarkan pengucapan terjemahan dan teks aslinya.

Selain terjemahan teks, Yandex.Translation memungkinkan Anda melihat entri kamus terperinci dari kamus mesin, yang mencakup terjemahan yang dikelompokkan, contoh penggunaan, transkripsi untuk kata-kata bahasa Inggris, jenis kata, dll. Selain itu, di bidang input teks Anda dapat melihat sinonim untuk kata tertentu, yang memungkinkan Anda meningkatkan kualitas terjemahan. Untuk melihat kamus dan daftar sinonim, Anda perlu mengklik kiri pada kata apa saja dan tahan selama 1 detik. Saat Anda memilih sinonim apa pun dengan mouse, maka secara otomatis akan mengganti kata aslinya. Sinonim tersedia untuk kata-kata Rusia, Inggris, Ukraina, dan Belarusia.

Penerjemah Yandex, seperti layanan dari Google, didasarkan pada studi teks paralel, tetapi bekerja agak berbeda, membandingkan tidak hanya kata-kata individual, tetapi juga frasa dari dua, tiga, empat atau lima kata berturut-turut dan fokus, sehingga tidak begitu banyak untuk terjemahan kata-kata individual, serta untuk terjemahan seluruh blok semantik.

Jika kualitas terjemahan yang dihasilkan tidak memuaskan Anda, Anda dapat menggunakan masukan dari pengembang atau mengikuti tautan “Lihat terjemahan di Google dan Bing.” Kehadiran link semacam itu justru menjadikan penerjemah Yandex menjadi integrator layanan terjemahan.

Tes

Sekarang mari kita coba layanan terjemahan beraksi. Untuk melakukan ini, kami menggunakan beberapa tes tematik singkat (sangat menarik bagaimana pemilihan topik kamus di Translate.Ru akan bekerja), sebuah anekdot dan contoh ucapan tidak langsung (yang, seperti halnya kalimat pasif, sering terjadi masalah) . Kami akan melakukan terjemahan hanya ke dalam bahasa Rusia. Tentu saja, pengujian tersebut masih jauh dari kelengkapan yang disediakan oleh metodologi BLEU, namun pengujian ini juga dapat memberikan “bahan pemikiran” atau, dalam kasus ekstrim, memungkinkan Anda meluangkan beberapa menit tanpa merasa bosan mengamati upaya asisten elektronik kami. Jadi…

Mobil. Ruang kabin telah diperbarui dan ada pilihan cat dan roda baru. Pembeli juga dapat memilih di antara serangkaian mesin berbahan bakar bensin atau solar dan dengan tiga atau empat silinder. Pilihan berkisar dari 1,0 liter inline-tiga dengan 74 tenaga kuda semua hingga 1,4 liter turbo empat dengan 148 . Suspensi dan sistem kemudi juga telah dikerjakan ulang. (Kursi memperlihatkan keluarga hatchback Ibiza facelift di Barcelona)

Semua penerjemah mempunyai masalah dengan pengaturan “juga”. Misalnya, Google menawarkan opsi berikut: “Suspensi dan sistem kemudi juga telah didesain ulang”). Namun semua orang mengetahui tenaga kuda, bahkan dalam bentuk “hp”, dan Google serta Yandex juga menunjukkan opsi terjemahan. Dan setiap orang memiliki miliknya sendiri. Translate.Ru, tanpa menyebutkan topik "Mobil", dengan keras kepala menganggap "kabin" sebagai kabin. Namun setelah mendengarkannya, saya mungkin menemukan opsi terjemahan yang paling dapat diterima. SYSTRANet mendekati frasa ini dari sisi lain: “Ruang kabin” yang ia terjemahkan sebagai “Ruang Kabin”.

Sepak bola. Riyad Mahrez mencetak dua gol awal saat Leicester City mengambil langkah lain menuju keselamatan Liga Premier dengan kemenangan atas Southampton yang lesu. Penyerang Aljazair itu mencetak gol melalui tendangan rendahnya pada menit ketujuh dan segera menggandakan golnya ketika memanfaatkan umpan tarik Jamie Vardy.(Riyad Mahrez mencetak dua gol di awal)

Teksnya ternyata sangat sulit. Satu demi satu, para penerjemah menyarankan untuk menekan atau menekan kurung kurawal awal (“tekan kurung kurawal awal”), dan Google juga dengan senang hati menyarankan kurung kurawal. Sangat menyenangkan bahwa semua penerjemah kecuali SYSTRANet dengan benar mengidentifikasi klub Leicester City, dan Yandex bahkan mencantumkan namanya dalam tanda petik. Translate.Ru dengan pengaturan sepak bola adalah satu-satunya yang dengan tepat mengidentifikasi "jaring" sebagai sesuatu yang terkait dengan jaring gawang: "Penyerang Aljazair menemukan jaring...", dan Yandex adalah satu-satunya yang menentukan bahwa jaring tersebut adalah penyerang mereka (setelah itu Yandex tidak lagi tertarik dengan tujuannya). "Low drive" adalah "low drive" (Yandex) dan "low drive" (Bing), dan... Tapi jangan membicarakan hal-hal yang menyedihkan (ini tidak berarti saya mendukung Southampton). SYSTRANet melampaui semua orang: “Bagian depan Aljazair menemukan jaringan dengan drive rendah…”

gadget. Phablet pada dasarnya adalah ponsel yang lebih besar atau tablet yang lebih kecil dengan kemampuan radio seluler. Meskipun ada tablet berukuran 8 inci yang lebih kecil seperti iPad Mini dan Samsung Galaxy Tab 8 yang memiliki kemampuan seluler, definisi phablet terbatas pada ukuran layar di bawah 7 inci - mungkin itulah batas betapa konyolnya memasang perangkat seperti itu di telinga Anda untuk digunakan sebagai telepon. (Apakah phablet adalah masa depan ponsel pintar?)

Semua penerjemah mengatasi tugas tersebut: terjemahan mereka memungkinkan kami untuk memahami arti pesan secara utama. Namun, tidak ada seorang pun yang mampu mengatasi “olahraga”. Tapi Translate.Ru yang sopan menerjemahkan: “ telingamu» secara eksklusif sebagai “Telinga Anda”.

Candaan.

- Benarkah segalanya antara Rosalie dan kamu, Michael, sudah berakhir? Setahun penuh Anda menemani.

- Bayangkan saja!

- Dan apakah kamu memberitahunya tentang pamanmu yang kaya, yang satu-satunya pewarismu?

- Itu hanya karena aku memberitahunya tentang hal itu. Dia meninggalkanku untuk menjadi bibiku.

Tanda hubung Em tidak menjadi masalah dalam penerjemahan. Google dan Yandex mengatasi tugas tersebut lebih baik daripada yang lain. Mereka berdua menyadari bahwa “Dia meninggalkanku untuk menjadi bibiku.” Benar, karena alasan tertentu Yandex memutuskan untuk mengganti nama pahlawan Mikhail.

Pidato tidak langsung.

Dia bilang aku cantik.

Dia bilang aku sangat cerdas.

Dia bilang aku menari dengan sangat baik.

Dia bilang aku punya rambut yang indah.

Dia bilang dia tidak akan pernah melupakan hari itu.

Yandex ternyata hampir sempurna. Nilailah sendiri:

Dia bilang aku cantik.

Dia bilang aku sangat pintar.

Dia bilang aku menari dengan sangat baik.

Dia bilang aku punya rambut yang indah.

Dia bilang dia tidak akan pernah melupakan hari itu.

Google juga bagus. Namun yang mengherankan, Yandex menganggap subjek pembicaraan (memiliki rambut halus, tampan, dan menari dengan baik) adalah seorang wanita, sementara Google menyarankan opsi maskulin, misalnya, “Saya mempunyai rambut bagus.” Tapi kita harus memberikan haknya; gender feminin juga hadir di antara pilihan terjemahan. Mungkin ini menunjukkan bahwa Yandex menganalisis kelompok kata yang lebih panjang. Bing ragu-ragu: terkadang objek pembicaraannya adalah seorang wanita, terkadang seorang pria sejati. SYSTRANet melakukan generalisasi paling jauh, menggunakan gender netral: “Saya menari dengan sangat baik.” Kalimat terakhir tidak mudah bagi banyak peserta tes. Versi terjemahan: "Dia bilang dia tidak akan pernah melupakan hari itu."

“Jadi penerjemah mana yang terbaik?” - pembaca akan bertanya. Jika kita berbicara tentang penerjemah desktop “untuk setiap hari”, maka menurut saya, itu adalah Google atau Yandex.

Nilailah sendiri. Semua sistem mengatasi terjemahan ke dalam bahasa Rusia dengan cara yang kira-kira sama: hasil upaya mereka memungkinkan untuk memahami makna teks. Mungkin SYSTRANet tertinggal. Jika, selain bahasa Rusia, Anda menggunakan bahasa Belarusia atau Ukraina, pilihan Anda adalah Google atau Yandex. Google adalah pemimpin dalam banyak kemungkinan: ia memiliki terjemahan dokumen dan input suara, yang tidak dimiliki Yandex. Namun, menerjemahkan seluruh dokumen bukanlah “fitur” yang populer, karena penerjemah yang bersemangat dapat merusak format dokumen sumber. Masukan suara- juga masih eksotik, meski sangat menjanjikan. Namun dalam hal terjemahan reguler, Yandex telah membuat langkah maju yang signifikan dan kini, mungkin, tidak kalah dengan Google.

Saya juga ingin menambahkan itu sebagai alternatif penerjemah otomatis dapat melayani pelayanan bagi yang hidup terjemahan daring. Misalnya - Penerjemah online profesional.

Dmitry Khramov