Az átírás a beszéd hangból vagy videóból szöveggé fordítása. Szolgáltatások választéka hang szöveggé átírásához A szolgáltatás felismeri a beszédet

A videotartalom népszerűsítése ellenére a szöveges dokumentum mindig nyerni fog mind az online dokumentumok készítésekor, mind a weboldalak kitöltésekor. Mindennek ellenére az átírás, más szóval a hang szöveggé fordítása a mai napig keresett szolgáltatás.

Olvassa el ezt a cikket, amelyből megtudhatja, milyen módszerekkel fordíthatja le a hangot vagy a videót szöveggé a legkevesebb erőfeszítéssel.

Az átírás a beszéd szöveggé fordítása. Lefordíthatja mind a hangfájlokat (diktafonos felvételek, dalok stb.), mind a videót (filmek beszédeit).

Az átírás meglehetősen munkaigényes folyamat. Az élen az a képességed, hogy gyorsan... (eleinte azt akartam írni, hogy „gép”, de mondd, nem a tanár diktálása alapján írtunk az iskolában, ez nem hanganyag fordítása szöveggé ?) gépelje be és írjon.

Ez a szakma már évek óta keresett. Egy modern blogger sem idegenkedik attól, hogy valamilyen videóban egy már tárgyalt témát használjon a hang szöveggé fordításával.

Ebben a cikkben megvizsgáljuk a szövegbe történő átírás 6 módját, és a kézi átírásra szolgáló programokkal kezdjük.

Programok hang szöveggé fordítására

Amint megértjük, az átírás a beszéd szöveggé fordítása. Vagyis mindent le kell írnunk, amit mondanak nekünk.

Alapfokú és szakmai programok egyaránt vannak erre a célra.

Szövegszerkesztő Microsoft Word

A hangok szöveggé fordításának legáltalánosabb módja a következő:

  1. Hang- vagy videofájl lejátszása.
  2. Nyisson meg egy szövegszerkesztőt.
  3. Hallgassa meg és írja be a szöveget.

Kezdetben azt terveztem, hogy a Word-ről írok ebben a részben, de miután végiggondoltam, úgy döntöttem, hogy bármelyik szövegszerkesztő megteszi: Jegyzettömb, Word, Google Docs, LibreOffice Writer és mások. A lényeg az, hogy szöveget tudjunk beírni a billentyűzetről.

Ennek a módszernek az a banalitása, hogy többször is meg kell hallgatnia ugyanazt a hangrészletet, hacsak természetesen nem rendelkezik fantasztikus gépelési sebességgel.

Ennek a módszernek mégis joga van létezni.

Professzionális átírási szoftver Express Scribe

Úgy döntött, hogy elkezdi a hangot szöveggé lefordítani? A legjobb, amit kínálhatunk, az Express Scribe.

Ez a program lehetővé teszi a szöveg közvetlen beírását, miközben hang- vagy videofájllal dolgozik a szomszédos ablakban. Ez így működik:

  1. Töltsön fel egy hang- vagy videofájlt magába a programba.
  2. A gyorsbillentyűk segítségével konfigurálhatja a videó lejátszásának vagy leállításának funkcióit.
  3. A következő ablakban szöveget kell beírni.

A fejlesztők egy fizetett és kissé lecsupaszított ingyenes verziót biztosítanak. Ami engem illet, ha nem foglalkozol professzionális átírással, akkor az ingyenes verzió is elég lesz.

A mínuszok közül: angolul van, és nincs lokalizáció. Bár a felület annyira áttekinthető, hogy a nyelvi akadály nem lehet akadály.

Előnyök:

  • Szöveg beírásához nem kell váltani a programok között.
  • A gépelési sebességtől függően a felvétel lejátszási sebességét saját igényei szerint állíthatja be.
  • Számos testreszabható gyorsbillentyű található, amelyek segítenek a programmal való munkában.
  • Lehetőség van időkódok egyeztetésére.

LossPlay lejátszó dekódolókhoz

A LossPlay lejátszó audio- és videofájlok modernizált lejátszója. A funkcionalitás ötlete a híres Winamp lejátszón alapult.

Az átírás a következő elv szerint történik:

  1. Indítsa el a LossPlay lejátszót.
  2. Adjon hozzá egy hang- vagy videofájlt.
  3. Nyissa meg bármelyik szövegszerkesztőt, amelybe szöveget fogunk beírni.
  4. Indítsa el a fájl lejátszását.

Miben különbözik ez a módszer a legelső által javasolt módszertől?

Lényegében igen, az ötlet ugyanaz. És mégis van néhány árnyalat. A helyzet az, hogy amikor elindít egy audio- vagy videofájlt, a lejátszó minimálisra csökkenthető, és csak szövegszerkesztőben dolgozhat. A lejátszó gyorsbillentyűkkel érhető el, amelyek a következőkre használhatók:

  • indítsa el a lejátszást;
  • lejátszás leállítása;
  • lassítja a lejátszást;
  • állítsa be az időkódot;
  • és még sok más.

A fejlesztő szerint a LossPlay ideális a hang szöveggé fordítására. A termék funkcionalitást tekintve egyenrangú a professzionális fejlesztésekkel, de előnye, hogy alacsonyabb a számítógépes rendszerigény fogyasztása.

Ingyenes online programok hangok szöveggé fordításához

Amint a cikkben már említettük, az átírási szakma keresett. Természetesen az emberek megpróbálják megkönnyíteni az életüket, és megpróbálnak online programokat létrehozni - asszisztenseket, amelyek automatikusan lefordítják a hangot szöveggé.

A jövőre nézve azt mondom, hogy a szakmára nem lenne akkora kereslet, ha 100%-ban működnének az ilyen programok, de néhány fejlesztés már létezik, és aktívan alkalmazzák.

A számítógép beállítása az átíráshoz

Mielőtt elkezdené az automatikus átírást szöveggé, megfelelően be kell állítania a számítógépet.

Rengeteg olyan cikk található az interneten, amelyek harmadik féltől származó fejlesztések használatát javasolják a hangkártya konfigurálásához. Talán ez szükséges a szakemberek számára, de tapasztalataim szerint elegendőnek bizonyult a beépített hangkártya megfelelő konfigurálásához.

Két lehetőségünk van:

  1. Kapcsolja be az audiofájlt, és helyezzen mikrofont a hangszórókra (őrült). A hangszórók beszéde bekerül az online programba, és a hang automatikusan szöveggé lesz fordítva.
  2. Állítson be egy hangkártyát, és csatlakoztasson egy sztereó keverőt, hogy a rendszer hangja bejusson az online programba.

Az első lehetőség rossz, mert előfordulhatnak további zavaró zajok, a program beolvassa, és a végén szemetet kap.

A második lehetőségben a beszédet az audiofájlból közvetlenül az online programba küldi, és a rendszer úgy érzékeli, ahogy van. Egyébként ebben az esetben nem minden sima.

Nyissa meg a „Hang” ablakot a „Vezérlőpulton”.

A „Lejátszás” lapon be kell állítania azt az alapértelmezett eszközt, amelyhez a fő hangszórók csatlakoznak.

Kérjük, vegye figyelembe, hogy a képernyőképemen fejhallgató (alapértelmezett kommunikációs eszköz) és hangszórók (alapértelmezett eszköz) is csatlakoztatva vannak. Ez azért történt, hogy átírhassam a fájlt fejhallgatón keresztül hallgatva.

Nem tudom, lehet, hogy csak én vagyok így, de ha kikapcsolom a fő hangszórókat, a hang abbamarad a sztereó keverőbe, és a programok nem érzékelik a hangfolyamot. Ha valaki kitalálta részletesebben, írja meg kommentben.

A „Rögzítés” fülön a „Sztereó keverő” érdekel minket, amelyet alapértelmezés szerint kell kiválasztani.

Figyel!! Ha nem látja a „Sztereó keverőt”, kattintson jobb gombbal az ablak egy üres területére, és válassza a „Letiltott eszközök megjelenítése” lehetőséget.

Ha Önnek, mint nekem, nincs szüksége további csatlakozásokra az audiokimenethez, akkor a beállítás kész. Az én esetemben azt akartam, hogy a hang továbbra is a hangszórókból és a fejhallgatóból jöjjön.

Válassza ki a „Stereo mixer” tulajdonságait, és lépjen a „Listen” fülre. Itt a „Lejátszás erről az eszközről” elemben válassza ki a fejhallgatót vagy azt az eszközt, amelyre hangot szeretne kiadni.

Az eljárás befejezése után harmadik féltől származó programok és illesztőprogramok nélkül konfiguráltuk a hang vételét, hogy a számítógép rendszereszközén keresztül lefordítsák szöveggé.

Google Dokumentumok

A Google Dokumentumokat helyezem előtérbe. Ez egy szokásos szövegszerkesztő, amely a szokásos Microsoft Word analógja.

  1. Válassza az „Eszközök” → „Hangbevitel” lehetőséget (vagy „Ctrl” + „Shift” + „S”). A mikrofon aktiválva van, és egy üzenet arról szól, hogy engedélyezzük a program számára a számítógép mikrofonjához való hozzáférést (engedélyezze a hozzáférést a paraméterek megváltoztatása nélkül (ez legyen az alapértelmezett)).
  2. Indítsa el az Önt érdeklő videót bármelyik lejátszóban vagy a YouTube-on.
  3. Kattintson a mikrofonra a Google Dokumentumokban. Ha minden megfelelően van konfigurálva, és a Google Dokumentumok látja a hangfolyamot, megkezdődik a hangból szöveggé fordítás. Ellenkező esetben a hang hiányáról szóló üzenet jelenik meg.

Személyes véleményem lehet, hogy elfogult vagy szubjektív, de semmi több nem kell ahhoz, hogy a hangot szöveggé fejtsd.

  • A hangot a legtisztábban, hézagok nélkül fordítja szöveggé.
  • Kiváló funkcionalitás a szövegszerkesztéshez.
  • A hangfájl nem szinkronizálható az átírás kezdetével.

Hangpad Beszédpad

Jegyzettömb Spechpad, amely a https://speechpad.ru/ címen található. A fent leírt elv szerint működik. A hangfelvétel be van kapcsolva, a jegyzettömb elkezdi olvasni a beszédet és szöveggé lefordítani.

Ennek a jegyzettömbnek az az előnye, hogy a beállítások között van egy „Futtatás felvétellel szinkronban” funkció. Ez hogy működik:

  1. Menjen a jegyzettömb weboldalára (egyébként, hogy ne olvassa el a szöveg lábtörlőjét, regisztráljon a webhelyükön).
  2. Kattintson az „Átírás” gombra.
  1. Az „Átírás” panelen válassza ki a kívánt médiatípust. Az én esetemben „Youtube videó”.
  2. A „Lejátszandó azonosítófájl” mezőben adja meg a YouTube videókódját (például a https://www.youtube.com/watch?v=Xihpth5vmmM címhez, kód Xihpth5vmmM).
  3. Jelölje be a „Futtatás szinkronban rögzítéssel” jelölőnégyzetet.
  4. Kattintson a „Felvétel engedélyezése” gombra.

A videó a YouTube-ról indul, a Speechpad pedig azonnal megkezdi az átírást, szöveggé alakítva a hangot.

  • Hangfájl szinkronizálása szöveges átirattal.
  • Lejátszási sebesség szabályzó.
  • Nagyszámú beállítás.
  • A lefordított szövegrész fő blokkba átvitelekor néhány szó kimarad.

A Dictation.io hangátíró a https://dictation.io/speech címen található.

Az átírás elindításához csak indítsa el az audiofájlt, és kattintson a „Start” gombra. A videó végén másolja át az eredményt egy szövegszerkesztőbe, hogy dolgozzon vele.

  • A hangfájl szinkronizálása a szöveg átírásának kezdetével.
  • Az eredmény másolása egy gomb megnyomásával történik.
  • Nagyon sok beállítás létezik.
  • Még nem látták.

Az online hang-szöveg fordítás eredményei

A fejezet zárásaként szeretném bemutatni a bemutatott online programok – hang-szöveg fordítók – munkáját. Erre a célra a három kismalacról szóló meséből vették ki ugyanezt a részletet, és ez történt.

Google Dokumentumok

Az ókorban 3 kismalac élt a világon, anyjukkal laktak egy kis házban, egy nap eljött az idő, hogy elhagyják a pillanatot, amikor a disznómama magához hívta őket, és azt mondta, kedves gyermekeim eljött az idő, hogy kimenj a nagyvilágba és a gyerekekbe, és elkezdd élni a saját életed, de ne felejtsd el, bármit is teszel, tedd lelkiismeretesen, ez a legjobb módja a túlélésnek az anyjukat és egy idő után rábukkantak egy házépítésre alkalmas rönkre .a malacok közül a legfiatalabb úgy döntött, hogy szalmából épít házat.

Az ókorban 3 kismalac élt a világon, anyjukkal laktak egy kis házban, egyszer eljött az idő, hogy elhagyják az anyja házát, ekkor a disznómama odaszólt neki és azt mondta: Drága gyermekeim! itt az ideje, hogy kimenj a nagyvilágba és a gyerekekbe, és elkezded élni a saját életed, de ne felejtsd el, bármit is teszel, tedd lelkiismeretesen, ez a legjobb módja a túlélésnek. A 3 szeretetteljes malac búcsúzott az anyjukhoz és elindultak egy idő után egy házépítésre alkalmas rönkhöz.

Online átíró Dictation.io

3 kismalac élt egy ideig a világban 3 kismalac lakott az anyjukkal egy kis házban. kedves gyermekeim, eljött az idő, hogy kimenjetek a nagyvilágba és gyerekek, és elkezdjétek a saját életeteket élni, de ne felejtsétek el, bármit is csináltok, tegyétek ezt lelkiismerettel, ez a legjobb módja annak, hogy túléljétek a 3 kismalacot gyengéden szólva. búcsút édesanyjuktól és elindultak egy idő után, amikor egy mezőn találkoztak, de házépítésre alkalmas, a disznók közül a legfiatalabb úgy döntött, hogy szalmából házat épít.

Mindhárom program fő problémája az írásjelek hiánya, de ez a kapott szöveg szerkesztésével megoldható.

A visszafejtési munka felgyorsításának módjai

Mivel nagy tapasztalattal rendelkezem a szövegek beírásában, a következő következtetésekre jutottam arról, hogyan lehet felgyorsítani a hang szöveggé való dekódolását.

  1. Ha a videó lejátszási sebességét csökkenti, az átírás a legkevesebb hibával történik.
  2. Szöveg kézi gépelésekor az ideális séma a következő: meghallgatva → megjegyezve → lejegyzett. Ez a séma lehetővé teszi, hogy ne későbbre halassza a szerkesztést, hanem mindent egyszerre csináljon.
  3. Parancsok használata szöveg hozzáadásához. Képzeljük el, hogy az „Átírás” szó gyakran megjelenik a szövegben, adjuk hozzá a parancshoz, és az égő billentyűkkel jelenítsük meg a megfelelő helyeken.
  4. Nem számít, hogy kézzel vagy online programokkal gépel, minden szerkesztés és javítás a legvégén történik.


A Google fordítót általában a mikrofon által továbbított beszéd fordítására használják.



Az ötlet a felszínen hevert, és ehhez bizonyára programoknak kellett volna lenniük. Ugyanaz, mint a Google fordítónál.


De guglizva nem találtunk programot, kivéve két oldalt. Amely szerzőik szerint a Google mesterséges intelligenciájának teljes erejét kihasználta.


Megtalálták az első orosz nyelvű oldalt https://speechpad.ru/blog/windows-integration/



De bármennyire is sértő volt, a varázslat nem működött...


Találtunk egy angol nyelvű webhelyet: https://speechlogger.appspot.com/ru/

Az eredmény ugyanaz. De az előzővel ellentétben volt magyarázat.


Megmutatta, hogyan valósíthat meg egy egyszerűnek tűnő ötletet: használjon hangfájlt mikrofonjelként.


Ehhez a VB-CABLE virtuális audioeszköz illesztőprogramja szükséges. Ez az OpenSourse.


Őszinte köszönet a „rohadt nyugati” altruistáknak!


Telepítjük (Win 10 alatt tesztelve) és beállítjuk a mikrofon bemenetet a rendszerben ehhez az illesztőprogramhoz.


Nyissa meg a Google fordítót, kattintson a mikrofon képével ellátott gombra, és indítson el egy hangfájlt tartalmazó lejátszót.


És - Vaalya! A varázslat működik, szövegsorok jelennek meg a szemed előtt.



A szem felismerési pontossága 85-97%. De van egy korlát - 5 ezer karakter, ami nagyon sok. Ezért le kell állítania a felvételt, másolnia kell a szöveget, és folytatnia kell.


Ezzel egyidejűleg megtörténik a fordítás a második kiválasztott nyelvre. Istenem, mennyi furcsa fordítás fog megjelenni!


Kiegészítés: Van mód karakterkorlátozás nélkül. - ez a Google Docs, ugyanúgy működik, de nincs fordítás másik nyelvre. Köszönöm dioneo


Számomra úgy tűnik, hogy a Google blokkolja az állandó kapcsolatokat ugyanarról az IP-ről. Ezért ennek a módszernek az az értéke, hogy nem tudja blokkolni az összes IP-t, és ennek megfelelően ez a módszer hatékonyabb. Itt van egy szó a fejlesztőkre és a szerzőnél nagyobb "gurukra".


Minden jót és kényelmet.

Átírás- ez az átirat hang-- És videó anyagokat, azok tartalmát szöveggé lefordítva. Az ilyen anyagokban elmondottak szó szerint vagy bizonyos fokú cenzúrával jelennek meg egy szöveges dokumentumban. Ebben a cikkben a számítógépen történő átírás egyszerűsítésének módjairól fogunk beszélni. Úgy tűnik, mi a nehéz a visszafejtési folyamatban? Elővesz egy kényelmes médialejátszót, időnként szünetelteti a felvételt, és átírja a hallottakat.

1. Az átírás nehézségei

De nem, ez nem ilyen egyszerű. Ellenkező esetben az ilyen szolgáltatás iránt érdeklődők nem keresnének távmunkásokat a szabadúszó tőzsdéken.

Először is, nem mindenki tud ilyen munkát végezni. Egy önellátó, szorgalmas emberre van szükségünk, aki képes hosszú távú figyelemkoncentrációra. Tájékoztatásul: 1 óra felvétel átírása körülbelül 5 órát vesz igénybe.

Másodszor, nem mindig biztosítanak jó minőségű forráskódot az átíráshoz, és ez megnehezíti az átírási folyamatot. Ilyen esetekben az előadónak műszakilag is hozzáértőnek kell lennie ahhoz, hogy megoldja a felvételi interferencia kiküszöbölését.

Átírás– a folyamat erőforrás-igényes. A figyelem folyamatos átkapcsolása egyik feladatról a másikra, egyik programablakról a másikra gyorsan lemeríti az energiáját. Van valami mód ennek a folyamatnak a leegyszerűsítésére? Sajnos még nincs ideális módszer ennek a folyamatnak a automatizálására. Csak egy személy képes megbirkózni egy ilyen feladattal. De a munkája leegyszerűsíthető különálló szoftvereszközök segítségével.

A két programablakkal való munka kényelme érdekében - médialejátszóÉs szövegszerkesztő– a Windows modern verzióiban igénybe veheti a képernyőterület hatékony kihasználásának funkcióját Snap . A lejátszó ablakát a képernyő egyik részére rögzítjük, a szerkesztő ablakot a másikhoz.

Tanács: Hanganyagok átírásakor jobb, ha nagy vezérlőkkel rendelkező lejátszókat használunk, például az alkalmazást "Groove zene", amely a Windows 10-hez tartozik.

A videofelvételek átírásakor használhatja a szabványos Windows 10 videólejátszó - alkalmazások kompakt üzemmódját "Mozi és TV". Kompakt módban a lejátszó miniablakká változik, amely más ablakok tetejére van rögzítve, korlátozott számú vezérlővel. De ez a lista tartalmazza az összes működéshez szükséges gombot - a videó szüneteltetése, előre-hátra lépések.

Tanács: ha a forrás egy videó, hogy ne zavarja el a videó sorozat, kivonhatja a hangot hangfájlt. És már dolgozz is vele. Az ilyen műveleteket médiakonverter programok, például ingyenesek is végrehajthatják ConvertillaÉs Freemake Video Converter. És olyan programok, mint pl Adobe Audition vagy annak ingyenes megfelelője Vakmerőség segít javítani a hangminőséget, ha az eredeti sok kívánnivalót hagy maga után.

4. Harmadik féltől származó videolejátszók

Harmadik féltől származó videolejátszók Windowshoz, mint pl. KMPlayer, GOM, VLC, több funkcionalitást kínál majd, amelyek különösen az átírás során használhatók:

Testreszabható lépések előre és hátra;
Lejátszási sebesség beállítása;
Könyvjelzők beállítása;
Testreszabható vezérlőpanel;
Testreszabható gyorsbillentyűk.

Tanács: Egyes előadók inkább nem szüneteltetik a forrásanyagot, hanem lelassítják a diktáláshoz. Ez nem jó ötlet átírás-optimalizálási célokra. A diktálás írásakor fontosak a szünetek, amelyek akár mondatrészeket is elhatárolnak. Ráadásul a tudatunk rezonál a lassú lejátszásra, és ez ennek megfelelően lelassítja az elme munkáját és a gépelést.

5. Express Scribe program

– kifejezetten átírásra készült program. Felülete tetején található a médiafájlok hozzáadására szolgáló mező, alul egy lejátszó és egy szövegszerkesztő található. Előnyei között:

Egyetlen ablak a forrásokkal és szöveggel való munkához;
Támogatás a médiaformátumok nagy listájához;
Fájlok lejátszásának lassítására és felgyorsítására szolgáló funkciók;
Visszatekerés;
Jobb hangminőség;
Gyorsbillentyűk, valamint a játékkormánykerék lábpedáljainak használata bizonyos funkciókhoz;
Forráskódok mentése és dekódolása programprojektként;
Beírt szöveg exportálása ide Microsoft Word.

Hibák - az orosz interfész nyelvének támogatásának hiánya és a program készítőinek aktív előírása a fizetős kiadásaihoz, amikor az ingyenes verzióval dolgozik.

6. Hangbeviteli szolgáltatások

A hangadatok bevitelének lehetőségét kínáló webszolgáltatások talán a legoptimálisabb módja az átírás egyszerűsítésének. Különösen alkalmas azoknak, akiknek a gépelési sebessége sok kívánnivalót hagy maga után. A működési elv itt egyszerű: megjegyezzük a szövegrészeket, megismételjük a mikrofonba, és ezzel egyidejűleg javítjuk a szöveget - kijavítjuk a hibákat és beszúrjuk a civakodás jeleit.

A webszolgáltatás beszédfelismerő mechanizmussal van felszerelve . Az ebben az online szerkesztőben létrehozott dokumentumok az eszköz segítségével diktálhatók "Hangbevitel".

Az eszköz számos nyelvet támogat, beleértve az oroszt is. Azonban nem biztosít beállítást az adatbevitel automatikus letiltására. Ha néhány másodpercig nem beszél a mikrofonba, a hangbevitel le van tiltva. És mindig manuálisan kell bekapcsolni.

Egy másik webszolgáltatás - "Hangjegyzettömb Speechpad.ru"- sokszor hatékonyabb lesz, mivel ez egy szűk profilú projekt, és a beszédfelismerés a fő hangsúly. Hangadatok beviteléhez a szolgáltatási űrlapon meg kell nyomnia a rögzítés gombot. A szöveg az eredmény mezőben szerkeszthető. A mező alján van egy gomb "+Átírás".

Lejátszási lehetőséget ad a szolgáltatási űrlaphoz hang-És videó forráskódok az egy programablakban történő munkavégzéshez. Például egy videó átírásához YouTube, a szolgáltatási űrlapon ki kell választani a média típusát, és be kell illeszteni a megfelelő mezőbe ID (a webcím egy része a „=” jel után) .

Az oroszon kívül a szolgáltatás számos más nyelvet is támogat.

Tanács: képes felismerni két írásjelet - egy pontot és egy vesszőt. Meg lehet őket beszélni.

Ennek az átírási módszernek a hátránya az emberi beszédfelismerő mechanizmus tökéletlensége. Hány mobilfelhasználó, akik eleget játszottak velük "Ok Google" A keresési lekérdezések beírásakor arra a következtetésre jutottunk, hogy egyszerűbb volt megtalálni valamit a régi módon, a billentyűzet segítségével. Bármilyen szolgáltatást is használ, továbbra is szünetet kell tartania munka közben, és kis blokkokban kell követnie a felismert szöveget.

7. Átírási automatizálás

Az adatok hangbevitelének folyamata az átírás során maximálisan leegyszerűsíthető, ha a rendszerhangot hangrögzítési forrásként állítjuk be, és ennek megfelelően a mikrofonba való beszédet eltávolítjuk a műveletek láncolatából. Természetesen problémás források esetén ez a lehetőség nem működik. Ennek eredményeként olvashatatlan szemetet kapunk, amit könnyebb lesz átírni, mint szerkeszteni. Ha többé-kevésbé jó minőségű a felvétel, egy próbát megér.

Hívja elő a helyi menüt a hang ikonján a Windows feladatterületén, és válassza a lehetőséget. A megjelenő ablakban a helyi menü opcióival kapcsolja ki a mikrofont és kapcsolja be a sztereó keverőt.

A folyamatot azonban továbbra is ellenőrizni kell: az információ lényegében való elmélyüléshez időnként szüneteltesse a lejátszást a dekódolás javítása érdekében, és jelezze a civakodás nyomait.

8. És ami a legfontosabb...

A sípoló hangszóróval rendelkező laptopon az átírás problémás. Különösen nehéz esetekben azonban egy jó audiorendszer nem segít. A hang dekódolásával kapcsolatos állandó munkához jobb, ha fejhallgatót vásárol. És ha a munkát beszédfelismeréssel végzik, érdemes lehet egy jó minőségű headsetet nézni Hands Free .

Egyetlen program sem helyettesítheti teljesen a rögzített beszéd átírásának kézi munkáját. Vannak azonban olyan megoldások, amelyek jelentősen felgyorsíthatják és megkönnyíthetik a beszéd szöveggé fordítását, vagyis egyszerűsíthetik az átírást.

Mi az átírás

Az átírás a beszéd automatikus vagy kézi fordítása szöveggé, pontosabban egy hang- vagy videofájl szöveges formában történő rögzítése.

Vannak fizetett, fizetett feladatok az interneten, amikor az előadó bizonyos összeget fizet a szöveg átírásáért. Ebben az esetben az átírás kézzel történik.

Az átírást azonban megteheti automatikusan is, egy speciális program segítségével, amely képes „meghallgatni” a szöveget, és egyben „kinyomtatni”, további felhasználásra alkalmas szövegfájllá alakítva.

Hasznos a beszéd kézi fordítása szöveggé vagy speciális program segítségével

  • a hallgatók lefordíthatják a rögzített hang- vagy videóelőadásokat szöveggé,
  • weboldalakat és blogokat üzemeltető bloggerek,
  • írók, újságírók könyvek és szövegek írásához,
  • információs üzletemberek, akiknek szövegre van szükségük webináriumuk, beszédük stb. után,
  • szabadúszók, akik manuálisan fordítják le a beszédet szöveggé, hogy megkönnyítsék és felgyorsítsák munkájukat,
  • akik nehezen tudnak gépelni – lediktálhatnak egy levelet, és elküldhetik családtagjainak vagy barátainak,
  • egyéb lehetőségek.

Az automatikus beszéd-szöveg fordítás problémáiról

Két fő probléma van a beszéd program segítségével szöveggé fordításával: a rögzített beszéd minősége és a háttér jelenléte a felvételen zaj, zene vagy egyéb idegen hangok formájában.

Mindenkinek más a beszéde:

  • olyan gyorsan, hogy a szavakat lenyelik, vagy fordítva, nagyon lassan;
  • tiszta dikcióval, mint a hivatásos bemondók, vagy olyan kifejezéstelen, hogy nehéz bármit is megérteni;
  • kiváló kiejtéssel, vagy éppen ellenkezőleg, erős akcentussal, például, amikor egy külföldi beszél.

Milyen esetekben hozza a legjobb beszéd-szöveg eredményt az automatikus átíró program? A program többé-kevésbé jó minőségű fordítást készít, ha a felvételen szereplő személy tiszta dikcióval, normál beszédsebességgel, akcentus nélkül beszél. Ugyanakkor a beszédfelvétel nem tartalmaz idegen hangokat zaj, zene vagy más emberek beszélgetése formájában. Akkor reménykedhet egy jó automatikus fordításban, amely nem igényel manuális javításokat vagy minimális változtatásokat.

Más esetekben, amikor a beszéd nem kifejező és idegen zajok vannak, a program vagy alkalmazás segítségével történő fordítás sokkal rosszabb lesz. Talán néhány program vagy szolgáltatás jobban átírja az ilyen beszédet, mint más programok és alkalmazások, de nem kell csodát várnia.

Bizonyos esetekben még mindig érdemes szabadúszó tőzsdéhez fordulni, ahol egy valódi személy végzi el a fordítást manuálisan. A magas minőség azonban itt sem garantálható, hiszen a szabadúszó tud automatikus átíró programokat használni, és lusta lesz szerkeszteni az így kapott szöveget.

Leírjuk a számítógépen, mobilalkalmazásokon és online szolgáltatásokon elérhető leghatékonyabb eszközöket a beszéd szöveggé fordításához.

1 Webhely voicepad.ru

Ez egy online szolgáltatás, amely lehetővé teszi a beszéd szöveggé fordítását a Google Chrome böngészővel. A szolgáltatás mikrofonnal és kész fájlokkal működik. Természetesen a minőség sokkal jobb lesz, ha külső mikrofont használ, és saját maga diktál. A szolgáltatás azonban még a YouTube-videóknál is jó munkát végez.

Kattintson a „Rögzítés engedélyezése” lehetőségre, válaszoljon a „Mikrofon használata” kérdésre – ehhez kattintson az „Engedélyezés” gombra.

A szolgáltatás használatára vonatkozó hosszú utasítások összecsukhatók az 1. ábra 1-es gombjára kattintva. 3. Egy egyszerű regisztrációval megszabadulhat a reklámoktól.

Rizs. 3. Speechpad szolgáltatás

A kész eredmény könnyen szerkeszthető. Ehhez vagy manuálisan kell kijavítania a kiemelt szót, vagy újra be kell diktálnia. A munka eredményeit a személyes fiókjába menti, és letöltheti a számítógépére is.

A beszédpaddal való munkavégzésről szóló videoleckék listája:

A videókat átírhatod a Youtube-ról vagy a számítógépedről, de szükséged lesz egy keverőre, további részletek:

Videó „Hangátírás”

A szolgáltatás hét nyelven működik. Van egy kis mínusz. Ez abban rejlik, hogy ha egy kész hangfájlt kell átírnia, akkor annak hangja a hangszórókon keresztül hallatszik, ami további interferenciát okoz visszhang formájában.

2 Szolgáltatás diktálás.io

Egy csodálatos online szolgáltatás, amely lehetővé teszi a beszéd ingyenes és egyszerű fordítását szöveggé.

Rizs. 4. Szolgálati diktálás.io

ábrán látható 1. 4 – Az oldal végén kiválasztható az orosz nyelv. A Google Chrome böngészőben a nyelv van kiválasztva, de a Mozillában valamiért nincs ilyen lehetőség.

Figyelemre méltó, hogy a kész eredmény automatikus mentésének lehetőségét megvalósították. Ezzel elkerülhető a lap vagy a böngésző bezárása miatti véletlen törlés. Ez a szolgáltatás nem ismeri fel a kész fájlokat. Mikrofonnal működik. Diktáláskor meg kell nevezni az írásjeleket.

A szöveget teljesen helyesen ismeri fel, nincs helyesírási hiba. Írásjeleket saját maga is beilleszthet a billentyűzetről. A kész eredmény elmenthető a számítógépére.

3 RealSpeaker

Ez a program lehetővé teszi az emberi beszéd egyszerű szöveggé fordítását. Úgy tervezték, hogy különböző rendszereken működjön: Windows, Android, Linux, Mac. Segítségével a hallott beszédet mikrofonba konvertálhatja (például laptopba építhető), valamint hangfájlokká rögzítheti.

13 világnyelvet tud megérteni. A programnak van egy béta verziója, amely online szolgáltatásként működik:

Kövesse a fenti linket, válassza ki az orosz nyelvet, töltse fel audio- vagy videofájlját az online szolgáltatásba, és fizetjen az átírásért. Az átírás után a kapott szöveget másolhatja. Minél nagyobb az átíráshoz szükséges fájl, annál több időt vesz igénybe annak feldolgozása, további részletek:

2017-ben volt ingyenes lehetőség a RealSpeaker segítségével történő átírásra, de 2018 óta nincs ilyen lehetőség. Valószínűleg ahhoz, hogy az átírt fájlt ne tudjon letölteni minden felhasználó, egy pipának kell lennie a „Fájl sikertelensége 24 órán belül” mellett.

Az oldalon van egy online chat. A csevegés indítására szolgáló gomb az oldal jobb alsó sarkában található.

4 Beszédjegyzet

Alternatíva a korábbi alkalmazáshoz Androidon futó mobileszközökhöz. Ingyenesen elérhető az App Store-ban:

A szöveget a rendszer automatikusan szerkeszti, és írásjeleket ad hozzá. Nagyon kényelmes jegyzetek diktálásához vagy listák készítéséhez. Ennek eredményeként a szöveg nagyon megfelelő minőségű lesz. Létezik fizetős prémium verzió.

5 Sárkány-diktálás

Ez egy olyan alkalmazás, amelyet ingyenesen terjeszt az Apple mobileszközökre.

A program 15 nyelven tud működni. Lehetővé teszi az eredmény szerkesztését és a kívánt szavak kiválasztását a listából. Minden hangot egyértelműen ki kell mondania, nem kell felesleges szüneteket tartania és kerülnie kell az intonációt. Néha hibák vannak a szavak végződésében.

A Dragon Dictation alkalmazást az Apple kütyük tulajdonosai használják például arra, hogy bevásárlólistát diktáljanak egy boltban, miközben a lakásban mozognak. Amikor odaérnek, anélkül nézhetik meg a jegyzet szövegét, hogy meg kellene hallgatniuk.

Bármilyen programot is használ a gyakorlatban, készüljön fel az eredmények kétszeri ellenőrzésére és bizonyos módosítások elvégzésére.

Ez az egyetlen módja annak, hogy hibátlan, hibamentes szöveget kapjunk.

Hang és videó átírása szöveggé szabadúszó tőzsdéken

Ami a kézi fordítást illeti, beszédből szöveggé átírást rendelhet a központtól. A szabadúszó tőzsdén egyes felhasználók (vevők) megrendelést adnak le, kiválasztanak egy vállalkozót és kifizetik a munkát. Más felhasználók (szabadúszók) pedig megrendeléseket vesznek fel, elvégzik a szükséges munkát és fizetést kapnak érte.

Hogyan adhat le rendelést a szabadúszó tőzsdén? Először regisztrálnia kell a tőzsde webhelyén, azaz regisztrálnia kell ott. Ezután rendelést adhat le – átírási feladat.

A tőzsdén leadott megrendeléséhez kiválaszthat egy előadót - egy személyt, aki elvégzi az átírást. Ehhez az szükséges, hogy a potenciális előadók közül legalább egy vállalja a javasolt munkát. Ha senki nem vette át a megrendelést, akkor módosítania kell a paramétereit, például növelnie kell a munka árát.

Az elvégzett munka kifizetése nem közvetlenül a szabadúszónak, hanem szabadúszó csere útján történik. Rendelés leadásakor általában fel kell töltenie számláját az átírás befejezéséhez szükséges összeggel. Ezen túlmenően a közvetítésért csere jutalék is járhat fix összeg vagy a megrendelés összegének fix százaléka formájában. A munka ellenértéke a megrendelő általi ellenőrzés és jóváhagyás után történik. Leggyakrabban az összeget azzal egyidejűleg küldik meg a vállalkozónak, hogy a megrendelő jóváhagyta munkáját.

A rendelés leadása előtt érdemes elolvasni a csereszabályzatot az elvégzett feladat ellenőrzésére, fizetésére, valamint a váltóba történő be- és pénzfelvételre vonatkozóan. A pénzfelvételre azért van szükség, hogy az egyéb rendelések kifizetésére tervezett fennmaradó pénz visszakerülhessen a vevőhöz, és ne maradjon örökké a tőzsdén.

Az alábbiakban két jól ismert szabadúszó börzét ajánlok, ahol szabadúszó segítségével megrendelheti beszéd-szöveg fordítást: weblancer.net és freelance.ru.

Két szabadúszó csere

Hang és videó megfejtése szöveggé (átírás) a weblancer.net szabadúszó börzén:

Rizs. 5. (kattintson a nagyításhoz)

Szabadúszó csere weblancer.net

Egy másik csere, ahol megrendelheti hang-/videofelvételek átírását, a freelance.ru

Szabadúszó csere freelance.ru

Barátaim, a közelmúltban cikkek jelentek meg az oldalon a Windows hangbeviteléről. Az egyik cikkben megnéztük az újat, amit az őszi kumulatív frissítés, a Fall Creators Update hozott a Windows 10-re. A másikat bemutatták. Ez a kiadvány folytatja a Windows környezetben zajló hangadatok bevitelének témájával foglalkozó cikksorozatot, és megvizsgáljuk, hogyan automatizálható a hang- és képfelvételek szöveggé történő átírása.

Hang- és képfelvételek dekódolásának (átírásának) automatizálása

Tehát a webhely említett cikkeiben beszéltünk a szöveg beírásának lehetőségéről hangbevitellel. Az emberi beszédfelismerő technológiák folyamatos fejlesztése ellenére, barátaim, ebben a kérdésben még mindig vannak eszközeink, amelyek messze nem ideálisak. Ez részben magának az orosz nyelvnek a bonyolultságából adódik. Az egyszerűbb nyelvi modellel (kevesebb szóalakkal) rendelkező nyelveket - például az angolt, a spanyolt, az olaszt - a mesterséges intelligencia jobban megérti. És ennek megfelelően kevesebb hibával ismerik fel őket. Tehát függetlenül attól, hogy milyen orosz nyelvű (vagy más szláv nyelvű) hangbeviteli eszközt használnak, akkor is szerkesztenie kell valamit a kapott formában - javítania kell a végződéseket vagy akár a teljes szavakat, írásjeleket kell hozzáadnia stb. És nagy mennyiségű hangos gépelés esetén ez problémát jelent. Nem mindenki tudja egyetlen folyamatban diktálni a gondolatait, és ezzel egyidejűleg szerkeszteni a felismert szöveget. Alternatív megoldás ebben az esetben a folyamat két szakaszra bontása: először szabadon fejezze ki gondolatait hangrögzítőbe, majd tovább írja át a hangfelvételt ugyanazokkal az emberi beszédfelismerő eszközökkel. És persze útközben a szöveg szerkesztése a kapott formában.

A videó és hang átírását a résztvevők beszélgetéseinek szöveges rögzítésével a felvételeken átírásnak nevezzük. Az átírás manuális, nagyon munkaigényes folyamat. Az átírónak lépésről lépésre meg kell memorizálnia a felvétel egyes részeit, le kell állítania a lejátszást, és be kell írnia a memorizáltat egy szövegszerkesztőbe. Ez egy monoton munka, amely maximális koncentrációt igényel. Főleg, ha a videó- ​​vagy hangforrás minősége sok kívánnivalót hagy maga után. De ez akkor van így, ha mások beszélgetéseinek átirataival dolgozik, amelyek interferenciával, recsegéssel, gyenge jelekkel stb. A saját diktátumok átírásával, ha azok elfogadható felvételi minőségűek, és ha a dekódolási munka oroszlánrészét a mesterséges intelligenciára bízzák, egyszerűbb lesz a dolog. Már csak a kézi munka van hátra, a szövegjavítás.

Hogyan készítsünk jó minőségű hangfelvételt? És hogyan lehet ezután szöveggé átírni a beszédfelismerő technológiák segítségével?

Diktálás rögzítése

Gondolatainak digitalizálásához anélkül, hogy aktívan gépelne a billentyűzeten, le kell diktálnia őket egy mikrofonba, vagy be kell beszélnie egy videokamerába. Ehhez használhatja okostelefonját, majd átviheti az audio- vagy videofájlt a számítógépére. A diktálás hangfelvételét is hozzárendelheti bármely beépített vagy csatlakoztatott mikrofonnal rendelkező Windows-alapú eszközhöz. A Windows 7 szabványos eszközei közé tartozik a „Hangfelvétel” segédprogram.

A Windows 10 fedélzetén van egy szabványos univerzális hangrögzítő alkalmazás.

A „Tízben” hangjegyzeteket is rögzíthet és hallgathat a OneNote alkalmazáson belül.

A rendszer bármely verziójában használhat harmadik féltől származó programokat, hogy hangot rögzítsen mikrofonból, például az Audacity funkcionális audioszerkesztőt.

Nem számít, melyik hangrögzítő eszközt választja. Lehet, hogy nem is hangfelvétel, hanem webkamerával rögzített vagy monitor képernyőjéről rögzített videó. Ha ennek a videónak lenne hangja. Egy másik dolog fontos - hogy a kimeneti hang többé-kevésbé tiszta legyen, zajmentes és elfogadható jelszinttel. Ehhez hang- vagy képrögzítés előtt tesztelni kell a mikrofont, különösen a szájtól való elfogadható távolság megtalálása érdekében. Ha szükséges, növelheti a mikrofon érzékenységét: számítógépen ez vagy a hang rögzítésére vagy a monitor képernyőjének rögzítésére használt programban, vagy a rendszer hangbeállításaiban történik. Ez utóbbi esetben a Windows feladatterületén kattintson a jobb gombbal a hangerő ikonra, és válassza a „Rögzítési eszközök” lehetőséget.

A megnyíló tulajdonságablakban lépjen a „Szintek” fülre. A „Mikrofon Gain” oszlopban lévő csúszka húzásával adjon hozzá dB-t, kattintson az „OK” gombra, és tesztelje a hangfelvételt.

Először növeljük 10 dB-lel. Ha a jel továbbra is gyenge, növelheti 20 dB-re. Nem kell többet hozzáadni 30 dB-ig, általában zaj jelenik meg.

Rögzítjük a diktálást és elmentjük.

Sztereó keverő beállítása

A felvett diktálás átírásához szükséges az emberi beszédfelismerő eszköz megtévesztése, és a mikrofonból érkező hang helyett egy hang- vagy képfelvétel hangját kell helyettesíteni - pl. rendszerhang, amelyet a számítógépünk hangszóróiból hallunk. Ezt sztereó keverővel lehet megtenni. Csakúgy, mint a mikrofon beállításakor, hívja elő a helyi menüt a Windows feladatterületének hangerő ikonján. És válassza a „Rögzítő eszközök” lehetőséget.

Éppen ellenkezőleg, bekapcsoljuk a sztereó keverőt. Kattintson az „Ok” gombra az ablak alján.

Mi a teendő, ha a rendszerben nincs sztereó keverő a felvevő eszközök között? Újra kell telepítenie az audio-illesztőprogramot. A Windows az illesztőprogramok automatikus telepítésekor gyakran csak alapvető hangfunkciókat biztosít. És az audio-illesztőprogram frissítése vagy újratelepítése a rendszereszközkezelővel általában nem tesz semmit ebben a tekintetben. Először el kell távolítania az audio-illesztőprogramot. Ezután lépjen az alaplap, laptop vagy különálló hangkártya webhelyére, töltse le az audio-illesztőprogram telepítőjét, és telepítse.