นักแปลธรรมดา

การแปลจดหมายจากคู่ค้าต่างประเทศหรือชิ้นส่วนจากเอกสาร - งานเหล่านี้และงานอื่น ๆ ที่เกิดจากความจำเป็นในการทำความเข้าใจเนื้อหาของข้อความในภาษาต่างประเทศอย่างรวดเร็วมักเกิดขึ้นบ่อยมาก วันนี้ บริการแปลภาษาออนไลน์ช่วยเอาชนะอุปสรรคด้านภาษา ภายในวันนักแปลซึ่งมีการเฉลิมฉลองในวันที่ 30 กันยายน เราจะพูดถึงเทคโนโลยีที่ใช้ทำงานของบริการดังกล่าว ทำความรู้จักกับพวกเขาด้วยตนเอง และพยายามเลือกสิ่งที่ดีที่สุด

เทคโนโลยี

มีสองเทคโนโลยีหลักสำหรับการแปลด้วยเครื่อง: Rule-Based Machine Translation (RBMT) และ Statistical Machine Translation (SMT) ในขั้นแรก เพื่อให้ได้คำแปล ให้ประยุกต์ใช้กับข้อความ กฎที่รู้กันภาษาดำเนินการในรูปแบบของอัลกอริธึมภาษาศาสตร์ เทคโนโลยีทางสถิติไม่ได้ใช้อัลกอริธึมดังกล่าว แต่จะค่อยๆ "เรียนรู้" ภาษาโดยการเปรียบเทียบข้อความคู่ขนานกันนับพัน - นั่นคือข้อความที่มีข้อมูลเดียวกัน แต่ใน ภาษาที่แตกต่างกัน- และเลือกตัวเลือกการแปลที่น่าจะเป็นไปได้บนพื้นฐานนี้

ลองพิจารณาเทคโนโลยีเหล่านี้ในรายละเอียดเพิ่มเติม

ขั้นตอนการแปลตามกฎสามารถแบ่งคร่าวๆ ได้หลายขั้นตอน

  • การวิเคราะห์ทางสัณฐานวิทยาโดยระบุเพศ จำนวน บุคคล และลักษณะทางสัณฐานวิทยาอื่นๆ ของคำ ในกรณีนี้ ปัญหาของความคลุมเครือเกิดขึ้น: คำเดียวกันสามารถอ้างถึงส่วนต่างๆ ของคำพูดได้ ตัวอย่างเช่น คำว่า "เป่า" ในภาษาอังกฤษสามารถใช้ได้ทั้งคำกริยา (เป่า เป่า) และเป็นคำนาม (ลมหายใจ) บน เวทีนี้การแปลทั้งสองได้รับการแก้ไข
  • แยกคำรวมกันเป็นกลุ่ม. ตัวอย่างเช่น กลุ่ม "หลายตัวอักษรที่ดี" (หลายตัวอักษรที่ดี) ประกอบด้วยคำเชิงปริมาณ "จำนวนมาก" เพื่อกำหนดพหูพจน์ คำคุณศัพท์ "ดี" และคำนามพหูพจน์ "ตัวอักษร" วิธีนี้ช่วยให้คุณแก้ปัญหาความกำกวมทางไวยากรณ์และลบความหมาย "พิเศษ" ของคำได้
  • การแยกประโยคนั่นคือคำจำกัดความของสมาชิกของข้อเสนอและตำแหน่งของพวกเขาในข้อเสนอ ขั้นแรก โปรแกรมจะค้นหาภาคแสดง จากนั้นก่อนที่จะพบภาคแสดง หัวเรื่องจะถูกค้นหา หากไม่มีอยู่ อัลกอริทึมจะมองหาประธานที่อยู่เบื้องหลังภาคแสดง หากไม่มีประธานในตัวอย่าง ให้ถือว่าประธานไม่อยู่ตามกรณี เช่น ในประโยคที่ไม่มีตัวตน (“พวกเขานำเค้กมา”)

การประสานงานของส่วนที่พบของประโยคและกลุ่มคำที่ขึ้นต่อกัน - การสังเคราะห์ประโยค.

วิธีการแปลที่คล้ายคลึงกันนี้ใช้ในบริการ SYSTRANet ของ บริษัท SYSTRAN และ Translate.Ru ของ บริษัท รัสเซีย PROMT

การใช้กฎเป็นวิธีเดียวในการแปลด้วยคอมพิวเตอร์จนถึงปี 2006 เมื่อบริการปรากฏขึ้น Google แปลภาษาโดยอิงจากแนวทางการแปลที่แตกต่าง - ทางสถิติ

สำหรับงานของคุณ ระบบแปลสถิติต้องการฐานข้อมูลที่กว้างขวางของข้อความคู่ขนาน แหล่งที่มาของข้อความดังกล่าวอาจเป็นเว็บไซต์ขององค์กรได้หลายภาษา เช่น ฐานข้อมูลเอกสารของสหภาพยุโรป ในขณะเดียวกัน เพื่อให้นักแปลทำงานได้อย่างถูกต้อง จำเป็นต้องมีในฐานข้อมูล ไม่ใช่แค่เอกสารขนาดใหญ่ แต่มีเอกสารคู่ขนานจำนวนมาก ไม่น่าแปลกใจเลยที่นักแปลสถิติรายแรกที่มีให้บริการคือบริการของเครื่องมือค้นหาที่ใหญ่ที่สุด - Google ในไม่ช้า ก็มีคู่แข่งตามมาด้วย: Bing with Microsoft Translator และ Yandex with Yandex.Translate

โดยค่าเริ่มต้น SYSTRANet ให้บริการแปลข้อความ หน้าเว็บ และงานพจนานุกรม ผู้ใช้ที่ลงทะเบียนยังสามารถเข้าถึงการแปลฟีด RSS ไฟล์และฟังก์ชัน "พจนานุกรมของตัวเอง" ได้อีกด้วย ยังฟรี บัญชีให้คุณใช้ตัวเลือก "การแปลขณะพิมพ์", "ความหมายทางเลือกของคำ" ฯลฯ

SYSTRANet ยังให้คุณแปลไฟล์ในรูปแบบ txt, rtf, htm เพื่อปรับปรุงคุณภาพการแปล นักพัฒนาเสนอให้ พจนานุกรมเฉพาะทางในเก้าหัวข้อ โดยรวมแล้วมีการประกาศแนวทางการแปลมากกว่า 35 แนวทางในระบบ


นักแปลออนไลน์ Translate.Ru โดย PROMT เก่าแก่ที่สุดใน Runet ที่ ช่วงเวลานี้รองรับ 9 ภาษา Translate.Ru ให้คุณเลือกหัวเรื่องของข้อความได้มากขึ้น การแปลที่ถูกต้อง. มีพจนานุกรมเฉพาะเรื่องให้เลือกทั้งหมด 16 พจนานุกรม ("กีฬา" "การเดินทาง" "คอมพิวเตอร์" ฯลฯ) รองรับฟังก์ชั่นตรวจสอบการสะกดคำและพจนานุกรม ในการดูรายการตัวเลือกการแปล คุณต้องเลือกคำในหน้าต่างข้อความต้นฉบับ จากนั้นคลิกที่ปุ่ม "พจนานุกรม" บนแถบเครื่องมือ - ตัวแปรทั้งหมดที่ระบบรู้จักจะแสดงในหน้าต่างแยกต่างหาก


หน้าต่างพจนานุกรมในแปลภาษา. รุ


Bing Translator นั้นใช้ Microsoft Translator - บริการคลาวด์การแปลสถิติจากไมโครซอฟต์ รองรับ 44 ภาษา ทั้งรัสเซียและยูเครน มีฟังก์ชั่นอ่านข้อความ ค้นหาข้อความใน เครื่องมือค้นหา, แปลหน้าเว็บและส่งงานแปลทางอีเมล์ ขีดจำกัดขนาดของข้อความที่แปลคือ 5,000 อักขระ


บริการแปลภาษาของ Google เป็นที่นิยมมากที่สุดบนอินเทอร์เน็ต รองรับ 80 ภาษา รวมถึงรัสเซีย ยูเครน และเบลารุส มีหน้าที่ แปลทันทีเมื่อผลลัพธ์ปรากฏขึ้นทันทีหลังจากป้อนข้อความต้นฉบับ ทิศทางการแปลจะถูกกำหนดโดยอัตโนมัติ หากคุณแทรกลิงก์ของเว็บลงในฟิลด์การแปล ทั้งหน้าจะถูกแปล คุณยังสามารถแปลเอกสารมาตรฐาน รูปแบบสำนักงานและรูปแบบ PDF


จากประโยชน์ คุณสมบัติของ Googleแปล ข้อสังเกตโดยเฉพาะคือโอกาสที่จะได้รับ การแปลทางเลือกคำและวลีส่วนบุคคล นอกจากนี้ ระบบยังมีการป้อนข้อมูลด้วยเสียงและความสามารถในการฟังเสียงของข้อความต้นฉบับและการแปล - ตัวอย่างเช่น คุณสามารถเล่นเสียงจากแท็บเล็ตหรือสมาร์ทโฟน จดจำเสียงเหล่านั้น และอธิบายตัวเองในต่างประเทศได้

ไม่มีการจำกัดจำนวนคำในข้อความที่ประมวลผล

บริการแปลออนไลน์จาก Yandex ปรากฏตัวในปี 2011 และปัจจุบันสามารถแปลได้ 46 ภาษา รวมถึงรัสเซีย ยูเครน และเบลารุส Yandex.Translate ทำงานในสองโหมด: การแปลข้อความและการแปลหน้าเว็บ ในการแปลหน้าเว็บ คุณต้องแทรกลิงก์ลงในช่องป้อนข้อมูลและคลิกที่ปุ่ม "แปล"

รองรับบริการ การตรวจจับอัตโนมัติภาษา หน้าที่ของการแปลทันทีและคำใบ้เมื่อพิมพ์ (โดยใช้ตัวอักษรตัวแรก บริการพยายามกำหนดความต่อเนื่องของคำ หรือ โดยคำนึงถึงบริบท จะแนะนำคำถัดไปที่มีแนวโน้มมากที่สุด) สำหรับภาษารัสเซีย ภาษาอังกฤษ และ ยูเครนตรวจตัวสะกดได้ คุณยังสามารถฟังการออกเสียงของคำแปลและข้อความต้นฉบับได้อีกด้วย

นอกจากการแปลข้อความแล้ว Yandex.Translate ยังให้คุณดูรายการพจนานุกรมโดยละเอียดจากพจนานุกรมของเครื่อง ซึ่งรวมถึงการแปลแบบกลุ่ม ตัวอย่างการใช้งาน การถอดเสียงคำภาษาอังกฤษ ส่วนของคำพูด ฯลฯ นอกจากนี้ ในฟิลด์ป้อนข้อความ คุณ สามารถดูคำพ้องความหมายหรือคำอื่นซึ่งช่วยปรับปรุงคุณภาพของการแปล หากต้องการดูพจนานุกรมและรายการคำพ้องความหมาย ให้คลิกซ้ายที่คำใดๆ ค้างไว้ 1 วินาที เมื่อคุณเลือกคำพ้องความหมายด้วยเมาส์ คำจะแทนที่คำเดิมโดยอัตโนมัติ มีคำพ้องความหมายสำหรับคำภาษารัสเซีย อังกฤษ ยูเครน และเบลารุส

Yandex Translator เช่นเดียวกับบริการจาก Google มีพื้นฐานมาจากการศึกษาข้อความคู่ขนาน แต่ทำงานในลักษณะที่แตกต่างกันเล็กน้อย ไม่เพียงเปรียบเทียบคำแต่ละคำเท่านั้น แต่ยังรวมถึงวลีที่มีคำสอง สาม สี่หรือห้าคำติดต่อกันและการวางแนว จึงไม่มากสำหรับการแปลคำแต่ละคำ สำหรับการแปลบล็อกความหมายทั้งหมด

หากคุณภาพของการแปลที่ได้รับไม่เป็นที่พอใจ คุณสามารถใช้คำติชมจากนักพัฒนาซอฟต์แวร์หรือไปที่ลิงก์ "ดูการแปลใน Google และ Bing" การมีลิงก์ดังกล่าวจะเปลี่ยนนักแปลจาก Yandex ให้กลายเป็นผู้รวบรวมบริการแปลภาษา

แบบทดสอบ

ตอนนี้เรามาลองใช้บริการแปลภาษากัน ในการทำเช่นนี้ เราใช้การทดสอบเฉพาะเรื่องสั้นๆ หลายครั้ง (น่าสนใจว่าการเลือกพจนานุกรมใน Translate.Ru ทำงานอย่างไร) เกร็ดเล็กเกร็ดน้อยและตัวอย่างคำพูดทางอ้อม (ซึ่งมักมีปัญหาเช่นเดียวกับเสียงแฝง) เราจะแปลเป็นภาษารัสเซียเท่านั้น แน่นอน การทดสอบดังกล่าวยังห่างไกลจากความสมบูรณ์ซึ่งจัดทำโดยวิธีการของ BLEU แต่ยังสามารถให้ "ข้อมูลสำหรับความคิด" หรือในกรณีที่ร้ายแรง ให้คุณใช้เวลาสองสามนาทีโดยไม่ดูความพยายามของผู้ช่วยอิเล็กทรอนิกส์ของเราอย่างน่าเบื่อ ดังนั้น…

ออโต้. พื้นที่ห้องโดยสารได้รับการปรับปรุงและมีตัวเลือกสีและล้อใหม่ ผู้ซื้อยังจะสามารถเลือกเครื่องยนต์ที่ใช้เชื้อเพลิงเบนซินหรือดีเซล และแบบสามหรือสี่สูบได้อีกด้วย ตัวเลือกมีตั้งแต่ 1.0 ลิตรอินไลน์สามที่มี 74 แรงม้า ไปจนถึงเทอร์โบสี่ลิตรขนาด 1.4 ลิตรที่มี 148 ระบบกันสะเทือนและระบบบังคับเลี้ยวถูกทำใหม่เช่นกัน. (ที่นั่งเผยโฉมตระกูล Ibiza hatchback ที่ปรับโฉมในบาร์เซโลนา)

นักแปลทุกคนมีปัญหากับเลย์เอาต์ "เช่นกัน" ตัวอย่างเช่น Google แนะนำสิ่งต่อไปนี้: "ระบบกันสะเทือนและระบบบังคับเลี้ยวได้รับการออกแบบใหม่เช่นกัน") แต่ทุกคนหาแรงม้าได้แม้จะอยู่ในรูปของ "hp" และ Google และ Yandex ก็แสดงตัวเลือกการแปลด้วย และทุกคนก็มีเป็นของตัวเอง Translate.Ru โดยไม่ระบุหัวข้อ "รถยนต์" ถือว่า "ห้องโดยสาร" เป็นห้องโดยสารอย่างดื้อรั้น แต่เมื่อเข้ามาแล้ว เขาจึงแจกฉบับแปลที่เป็นที่ยอมรับมากที่สุด ในทางกลับกัน SYSTRANet เข้าหาวลีนี้: "พื้นที่ห้องโดยสาร" เขาแปลว่า "พื้นที่ห้องโดยสาร"

ฟุตบอล. ริยาด มาห์เรซ ทำสองประตูก่อนขณะที่เลสเตอร์ ซิตี้ ก้าวไปอีกขั้นสู่ความปลอดภัยในพรีเมียร์ลีกด้วยชัยชนะเหนือเซาแธมป์ตันที่น่าเบื่อหน่าย กองหน้าชาวแอลจีเรียทำประตูได้ด้วยการขับต่ำในเจ็ดนาที และในไม่ช้าก็เพิ่มคะแนนเป็นสองเท่าเมื่อดึงตัวกลับของเจมี่ วาร์ดี้กลับบ้าน(ริยาด มาห์เรซ ตีสองก่อน)

ข้อความนั้นยากมาก นักแปลทีละคนแนะนำให้ตีหรือบีบวงเล็บปีกกา ("ตีวงเล็บปีกกาก่อน") และ Google ก็แนะนำเครื่องมือจัดฟันแบบหยิกด้วย เป็นเรื่องดีที่นักแปลทุกคนยกเว้น SYSTRANet ระบุสโมสรเลสเตอร์ซิตี้ได้อย่างถูกต้อง และยานเดกซ์ยังใส่ชื่อไว้ในเครื่องหมายคำพูด Translate.Ru ที่มีการตั้งค่าฟุตบอลเป็นคนเดียวที่ระบุ "ตาข่าย" อย่างถูกต้องว่าเป็นสิ่งที่เกี่ยวข้องกับตาข่ายประตู: "กองหน้าชาวแอลจีเรียพบตาข่าย ... " ("กองหน้าชาวแอลจีเรียพบตาข่าย") และยานเดกซ์คือ มีเพียงคนเดียวที่ตัดสินใจว่าเขาได้พบข้างหน้าของพวกเขาแล้ว (หลังจากนั้นยานเดกซ์ไม่ได้อยู่ที่ประตูอีกต่อไป) "ไดรฟ์ต่ำ" เป็นทั้ง "ไดรฟ์ต่ำ" (ยานเดกซ์) และ "ไดรฟ์ต่ำ" (Bing) และ ... แต่อย่าพูดถึงสิ่งที่น่าเศร้า ทำได้ดีกว่าโดย SYSTRANet: "แนวรบแอลจีเรียพบเครือข่ายไดรฟ์ต่ำ..."

แกดเจ็ต. Phablets เป็นโทรศัพท์ขนาดใหญ่หรือแท็บเล็ตขนาดเล็กที่มีความสามารถวิทยุมือถือ ในขณะที่มีแท็บเล็ตขนาด 8 นิ้วที่เล็กกว่าเช่น ไอแพดมินิและ Samsung Galaxy Tab 8 ที่เล่นมือถือได้แบบสปอร์ต คำจำกัดความของ phablet นั้นจำกัดขนาดหน้าจอที่ไม่เกิน 7 นิ้ว ซึ่งอาจจะเป็นข้อจำกัดของการใส่อุปกรณ์ดังกล่าวแนบหูเพื่อใช้เป็นโทรศัพท์. (phablet เป็นอนาคตของสมาร์ทโฟนหรือไม่)

นักแปลทุกคนรับมือกับงานนี้: การแปลของพวกเขาทำให้สามารถเข้าใจความหมายของข้อความโดยพื้นฐานได้ อย่างไรก็ตาม ไม่มีใครเข้าใจ "กีฬา" แต่ Translate.Ru สุภาพแปลว่า “ หูของคุณ» แต่เพียงผู้เดียวในฐานะ "หูของคุณ"

เรื่องตลก.

- จริงหรือไม่ที่ทุกอย่างระหว่างโรซาลีกับคุณ ไมเคิล จบลงแล้ว? หนึ่งปีที่คุณอยู่เป็นเพื่อน

- แค่คิด!

- แล้วคุณเล่าให้เธอฟังเกี่ยวกับคุณลุงรวยที่มีคุณเป็นทายาทคนเดียวหรือเปล่า

- มันเป็นเพียงเพราะฉันบอกเธอเกี่ยวกับเรื่องนี้ เธอทิ้งฉันให้เป็นป้า

Em dashes ไม่ได้กลายเป็นปัญหาในการแปล ดีกว่าคนอื่น ๆ รับมือกับงานของ Google และ Yandex ทั้งสองคิดว่า "เธอทิ้งฉันให้เป็นป้า" จริงด้วยเหตุผลบางอย่างยานเดกซ์จึงตัดสินใจเปลี่ยนชื่อฮีโร่เป็นมิคาอิล

คำพูดทางอ้อม.

เขาบอกว่าฉันสวย

เขาบอกว่าฉันฉลาดมาก

เขาบอกว่าฉันเต้นเก่งมาก

เขาบอกว่าฉันมีผมสวย

เขาบอกว่าเขาจะไม่มีวันลืมวันนั้น

ยานเดกซ์กลายเป็นเกือบสมบูรณ์แบบ ตัดสินด้วยตัวคุณเอง:

เขาบอกว่าฉันสวย

เขาบอกว่าฉันฉลาดมาก

เขาบอกว่าฉันเต้นเก่งมาก

เขาบอกว่าฉันมีผมสวย

เขาบอกว่าเขาจะไม่มีวันลืมวันนั้น

Google ก็ดีเช่นกัน อย่างไรก็ตาม น่าแปลกที่ยานเดกซ์มองว่าเป้าหมายของการพูด (ผมเส้นเล็ก น่ารัก และเต้นเก่ง) เป็นผู้หญิง ในขณะที่ Google แนะนำตัวเลือกสำหรับผู้ชาย เช่น "ผมสวย" แต่เราต้องให้เขาครบกำหนด ในบรรดาตัวเลือกการแปล เพศหญิงก็มีอยู่ด้วย บางทีนี่อาจเป็นจุดที่ยานเดกซ์วิเคราะห์กลุ่มคำที่ยาวขึ้น Bing ไม่แน่ใจ: บางครั้งผู้ทดลองเป็นผู้หญิง บางครั้งเป็นสุภาพบุรุษ SYSTRANet ไปไกลที่สุดในภาพรวมโดยใช้เพศที่เป็นกลาง: "ฉันเต้นได้ดีมาก" ประโยคสุดท้ายไม่ใช่เรื่องง่ายสำหรับผู้สอบหลายคน Variant from Translate: "เขาบอกว่าเขาจะไม่มีวันลืมวันนั้น"

“แล้วนักแปลที่ดีที่สุดคืออะไร” ผู้อ่านจะถาม หากเรากำลังพูดถึงนักแปลเดสก์ท็อป "สำหรับทุกวัน" ในความคิดของฉันมันจะเป็น Google หรือ Yandex

ตัดสินด้วยตัวคุณเอง ระบบทั้งหมดจัดการกับการแปลเป็นภาษารัสเซียในลักษณะเดียวกัน: ผลลัพธ์ของความพยายามทำให้สามารถเข้าใจความหมายของข้อความได้ เว้นแต่ SYSTRANet จะล้าหลัง หากคุณใช้ภาษาเบลารุสหรือยูเครน นอกจากภาษารัสเซียแล้ว ทางเลือกของคุณคือ Google หรือ Yandex ในแง่ของความเป็นไปได้มากมาย Google เป็นผู้นำ: มีการแปลเอกสารและการป้อนข้อมูลด้วยเสียงซึ่งไม่ได้อยู่ในยานเดกซ์ อย่างไรก็ตาม การแปลเอกสารทั้งหมดเป็น “คุณสมบัติ” ที่ไม่ได้รับความนิยมมากนัก เนื่องจากนักแปลที่กระตือรือร้นสามารถทำให้การจัดรูปแบบของเอกสารต้นฉบับเสียหายได้ ป้อนข้อมูลด้วยเสียง- ยังแปลกใหม่แม้ว่าจะมีแนวโน้มมาก แต่ในแง่ของการแปลเป็นประจำ ยานเดกซ์ได้ก้าวไปข้างหน้าอย่างมีนัยสำคัญ และตอนนี้อาจจะไม่ด้อยไปกว่า Google

ฉันยังต้องการเพิ่มว่าทางเลือกอื่นสำหรับนักแปลอัตโนมัติสามารถเป็นบริการของ live โอนเงินออนไลน์. ตัวอย่างเช่น - นักแปลออนไลน์มืออาชีพ

Dmitry Khramov