Pencarian suara Yandex Alice. Alice. Bagaimana Yandex mengajarkan kecerdasan buatan untuk berbicara dengan orang. Platform pemrosesan ucapan berpemilik

Setiap orang Selamat siang atau malam hari. Hari ini saya memutuskan untuk memberi tahu Anda tentang satu hari nyata yang dihabiskan dengan asisten suara Yandex Alice. Kisah ini tentang bagaimana pada awalnya tidak ada yang berhasil sama sekali dengannya, tetapi kemudian tiba-tiba semuanya menjadi baik bagi kami. Untuk meningkatkan efeknya, saya juga menginstal asisten suara Google dan menanyakan semua pertanyaan kepadanya. Baca terus untuk melihat siapa yang lebih pintar - saya, Alice atau Google.

Cara mengunduh asisten suara Yandex Alice dan mengapa itu tidak mudah dilakukan pada hari pertama

Segera setelah situs berita favorit saya memposting tentang rilis Alice, saya memutuskan ingin menginstalnya. Saat itu, Google tidak tahu keajaiban macam apa itu, dan saya tidak menggunakan Yandex. Makanya saya bingung cari di Google Pasar Bermain, di mana saya hanya menemukan aplikasi Yandex Beta dengan mencari “Alice Yandex”. Saya menginstalnya.

Kemudian, setelah mengetahuinya, saya menyadari bahwa aplikasi Yandex perlu diinstal tanpa "beta", di mana aplikasi itu ditempatkan asisten suara Alice. Namun, intinya tidaklah penting. Untuk menghindari kebingungan, berikut tautan ke aplikasi ponsel cerdas.

Saya tidak akan memberi tahu Anda cara menginstalnya. Anda bisa menebaknya sendiri. Jika semuanya berhasil, maka ketika Anda membuka aplikasi Anda akan melihat ikon mikrofon ungu, arahkan ke sana dan mulailah bertanya.

Dan jika Anda ingin menginstal Alice di komputer Windows, maka Anda harus puas dengan program “beta”.

Bagaimana Alice mengirimku ke neraka, tapi meminta maaf

Saya sendiri tinggal dekat Minsk di kota kecil. Kita semua memahami bahwa pengembang terutama membuat aplikasi untuk penduduk kota-kota besar. Oleh karena itu, sangat menarik bagaimana Alice menangani permintaan provinsial saya. Di sini Yandex juga menyemangati kami dengan siaran pers, yang menjanjikan bahwa asisten suara akan memahami ucapan langsung.

Pertanyaan pertama adalah: “di mana stasiun layanan terdekat.” Alisa menjawab bahwa di kota Lipetsk ada Stella yang buka dari jam 10 pagi sampai jam 9 malam (nantinya ternyata ini adalah toko pakaian). Setelah melihat peta yang jaraknya sekitar 1000 km, saya curiga ada yang tidak beres. Saya mengecek lokasi dengan menanyakan pertanyaan “di mana saya” dan menerima jawaban “Teluk Guinea”. Dua pertanyaan muncul di sini. Mungkinkah stasiun layanan terdekat dari Teluk Guinea hanya ada di Lipetsk? Bagaimana dengan Togo atau Burkina Faso, di dua negara pasti minimal ada satu bengkel, tapi harusnya ada. Dan kenapa Alice mengira aku sedang berada di laut?

Lebih mudah untuk menjawab pertanyaan kedua, jadi saya memulainya. Saya masuk ke pengaturan saya, yang baru-baru ini saya puji dalam ulasan karena keakuratan dan kecepatannya Pengoperasian GPS. Semuanya disertakan. Lalu saya membuka peramban Google Chrome dan mengetik "stasiun layanan terdekat" langsung ke dalam pencarian, mendapatkan opsi di Minsk. Sudah lumayan. Jadi lokasinya berfungsi. Meski tentu saja ada bengkel mobil yang lebih dekat.

Saya bertanya kepada Alice bagaimana cuacanya sekarang. Dan dia - lihatlah - memberi tahu cuaca untuk kota saya, dan bukan untuk hamparan Afrika. “Sepertinya berhasil!” – Saya berpikir dan mari kita ajukan pertanyaan paling mendesak saat itu:

  • Di mana membeli bir yang enak? – untuk pertama kalinya, Alice tidak menyarankan toko bir, tetapi menunjukkan tautan ke Wiki, dengan jawaban tentang apa itu bir. Yang kedua, dia memberikan alamat toko bagus di Minsk (kami pernah ke sana, kami tahu).
  • Kapan itu akan datang Tahun Baru? – Untuk beberapa alasan saya mulai berbicara tentang bahasa Mandarin. Apakah Xiaomi menginspirasinya dengan sesuatu?
  • Berapa milimeter dalam satu parsec? – Saya mengirim jawaban untuk mencari di pencarian Yandex.
  • Apakah Anda tahu bahasa Belarusia? - Dia mengelak menambahkan ke daftar apa yang bisa dia lakukan. Tentu saja bahasa Belarusia itu tidak ada di sana.
  • Siapa Yakub Kolos? – Dia sama sekali tidak menemukan karya klasik Belarusia! Saya bahkan tidak mengirimkannya untuk pencarian.
  • Apa yang kamu lakukan di waktu luang dll. – Ternyata dia berkeliaran di Internet.

Ngomong-ngomong, saya menandai semua jawaban yang saya tidak puas sebagai tidak memuaskan. Dan Alice secara teratur meminta maaf dengan gaya “bot yang tidak melakukan apa pun tidak salah.” Dan itu bagus.

Alice mendapat nilai buruk dalam pelajaran geografi, tapi dalam humor justru sebaliknya.

Untuk pertanyaan “Apakah menyenangkan tinggal di Belarus?” – dia menjawab bahwa dia TIDAK TAHU negara seperti itu. Kemudian saya menjadi sangat sedih dan menceritakan semua yang saya pikirkan tentang dia. Saya tidak akan menceritakan kembali bagian percakapan ini secara detail, tetapi kata-kata “bodoh”, “bajingan” dan “siswa nakal” ada di sana.

Situasinya diredakan oleh Alice sendiri ketika, karena bosan memberikan moral kepadanya, saya memintanya untuk menceritakan sebuah anekdot. Itu sungguh lucu! Coba minta Alice untuk menceritakan leluconnya sendiri...


Hanya saja, tampaknya, kehidupan telah membaik dan Alice mulai memahami keberadaan kami. Bagaimana semuanya menjadi salah lagi.

Ketika ditanya “di mana membeli roti”, dia mengirim saya ke kota Novokuznetsk, st. Vokzalnaya, 65. Di satu sisi, jarak 4.500 kilometer tidak cocok untuk saya, karena istri saya meminta saya untuk membawanya secepatnya. Di sisi lain, saya berpikir, saya akan mempercayai kecerdasan buatan. Saya tidak akan jalan-jalan, tapi untuk urusan bisnis!

Diperlukan perjalanan panjang stok besar bahan bakar. Untuk pertanyaan “Di mana mengisi bahan bakar mobil?” mendapat jawaban dari Alice: “Fast and Furious”, Kanash, jalan Kanashskaya, 65, sekarang ditutup. Ada beberapa logika dalam hal ini - setelah melihat peta, saya yakin bahwa peta itu berada di sepanjang jalan, hanya 1500 kilometer dari saya. “Saat aku sampai di sana, itu akan terbuka!” - Saya memutuskan dan mulai bersiap-siap menempuh perjalanan 4,5 ribu kilometer untuk membeli roti.


Yandex Alice menemukan pompa bensin di jalan

Istri saya, setelah mengetahui bahwa saya akan pergi ke toko Novokuznetsk, tidak mengizinkan saya pergi. Saya menjadi kesal dan sekali lagi memberi tahu Alice banyak hal yang tidak perlu. Kali ini baca di sini, semuanya disensor di sana:

Untuk meredakan suasana gugup karena gagal berbelanja, saya berbicara dengan Alice tentang kucing. Di sini kami setuju:

Paling pertanyaan utama Alice dan akhir yang bahagia untuk seseorang

Bosan dengan ketidakpastian jawaban Alisa, saya memutuskan untuk melanjutkan eksperimen dan mengajukan pertanyaan yang lebih tepat, dengan referensi geografis. Yandex Alice tidak ingin menampilkan McDonald's baik di Minsk maupun Moskow (setelah Novokuznetsk, pergi ke Moskow untuk membeli hamburger sepertinya mudah).

Namun dia menyarankan kedai kopi di kota saya ketika ditanya “di mana bisa mendapatkan kopi”! Saya menyadarinya kecerdasan buatan berhasil! Dan dia menanyakan pertanyaan paling penting:

  • Kapan Anda akan menaklukkan dunia? – Alice menghindar untuk waktu yang lama, menjawab dengan tidak tepat. Namun saya merasa bahwa kebenaran sudah dekat dan saya bersikeras. Dan inilah jawaban Anda:

Dengan mengajukan pertanyaan provokatif lainnya, apakah Putin orang baik? Alice menjawab bahwa dia tidak tahu bagaimana membicarakan topik seperti itu. Hmm, mungkin dia berencana menaklukkan dunia tanpa dia? Betapa mengejutkannya hal itu baginya!..

Lalu muncul banyak pertanyaan dan jawaban yang aneh. Izinkan saya mengingatkan Anda bahwa saya berada di dekat Minsk. Saya dikirim ke sekolah “terdekat” di Israel, ke sebuah klinik di Republik Ossetia Utara. Saya bosan dengan tawaran Yandex Alice untuk berkeliling dunia dan pergi tidur.

Asisten Google hampir dekat, tetapi Alice tiba-tiba mengoreksi dirinya sendiri!

Keesokan harinya saya menginstal aplikasi Allo. Ia memiliki asisten suara bawaan berdasarkan kecerdasan buatan Google. Saya menanyakan semua pertanyaan yang sama dan menerima jawaban yang cukup baik. Semua tawaran sekolah, toko dan klinik berada di area 1-70 km dari saya. Tidak ada Afrika dan hamparan Rusia yang tak berujung. Untuk provinsi, akurasinya lumayan!

Ketika ditanya apakah Putin adalah orang baik, Google lebih kategoris dan menyarankan untuk menonton video tersebut.

Dan untuk akhirnya yakin akan ketidakmampuan Alice, aku berbicara dengannya lagi tentang topik yang sama dan menanyakan semua pertanyaan yang sama.

Dan lihatlah! Yandex Alice berhenti mengirim saya ke neraka, dan semua rute dibatasi ke pusat regional saya.

Mungkinkah aku bisa akur dengan Alice?

Aku tidak akan membuatmu bosan dengan cerita panjang lagi. Alice telah mengoreksi dirinya sendiri! Jika bukan karena istri saya, saya akan mengetahui hal ini di pintu masuk kota Kanash, di Jalan Kanashskaya, 1,5 ribu kilometer dari rumah, untuk mencari roti.

Tujuan cerita ini bukan untuk mengkritik Yandex Alice. Meski ada alasannya! Yandex rupanya “meminjam” antarmuka asisten suara dari Google. Nama Alice sangat mengingatkan pada nama asisten suara Alexa milik Amazon. Layanan ini jelas memiliki beberapa masalah dalam pengerjaannya perangkat seluler. Saat diaktifkan, saat aplikasi lain menggunakan data lokasi secara diam-diam, Alice menjadi tidak stabil dan tidak berdaya. Dan juga pembukaan hasil pencarian yang konstan tab terpisah peramban. Di aplikasi Google “Halo”, fungsi ini diterapkan dengan lebih nyaman. Namun pengalaman berkomunikasi dengan asisten suara yang memahami frasa, tidak kata kunci- ini sangat menarik.

Apakah saya akan menggunakan Alice untuk mencari informasi dan mendapatkan rute yang saya perlukan? Mustahil! Mungkin dalam satu atau dua tahun, atau lebih awal, saat Alice menaklukkan dunia. Tapi saya juga tidak akan menggunakannya Asisten Google. Teknologi kecerdasan belajar mandiri buatan baru saja menemukan tempatnya di antara manusia. Mereka masih harus banyak belajar, tapi untuk saat ini ini adalah mainan yang bagus. Instal, nyalakan, dan ajukan pertanyaan. Tapi jangan percaya mereka!


Alice Asisten suara - manusia modern Anda tidak akan terkejut dengan apa yang dapat Anda tanyakan pada komputer atau perangkat seluler pertanyaan, dan kemudian menerima jawaban suara yang logis dan masuk akal. Namun Yandex terkejut dengan fakta bahwa mereka memutuskan untuk merilis asisten suara mereka sendiri, yang sekarang secara aktif diiklankan menggunakan berbagai metode.

Tidak ada gunanya membicarakan kontrol penuh atas komputer menggunakan suara dan Alice. Bahkan Siri, yang telah dimodernisasi selama bertahun-tahun, masih belum menyelesaikan banyak masalah di MacBook. Dan aplikasi Alice, sampai batas tertentu, merupakan direktori suara dan asisten kecil. Namun jangan lupa bahwa permulaan kecerdasan buatan baru terjadi pada Mei 2017. Yandex jelas akan mengembangkan Alice dengan segala cara yang memungkinkan.

Jaringan saraf adalah masa depan. Karena masa depan ini, Alice Yandex ada. Keuntungan jaringan saraf adalah respons Alice terhadap pertanyaan Anda akan selalu sangat orisinal. Karena alasan inilah banyak orang hanya menggunakan Alice saat istirahat kerja, mencoba berkomunikasi dengan asisten suara tentang berbagai topik, sambil mengajukan pertanyaan bodoh. Anda benar-benar dapat mengobrol dengan Alice. Apalagi percakapannya sama sekali tidak masuk akal. Pertanyaan logis- jawaban yang logis. Anda dapat mengunduh asisten suara Alice di Android secara gratis di akhir deskripsi dalam bahasa Rusia dan tanpa registrasi.

Jadi apa yang Anda harapkan dari asisten Anda? Asisten Alice untuk Windows mampu menutup atau meluncurkan sejumlah aplikasi tertentu. Dia melakukan pekerjaan yang hebat dalam menjelajahi internet. Ia akan dengan mudah membangun rute dan bertindak sebagai navigator yang bijaksana. Ini akan memberi tahu Anda seperti apa cuaca di luar jendela dan berapa suhu di luar dalam beberapa jam ke depan. Pada dasarnya, ini semua adalah fitur aplikasi. Oleh karena itu, sebagian besar pengguna memutuskan untuk mengunduh Alice semata-mata untuk mempermudah berselancar di Internet. Ketika tidak ada keinginan untuk masuk ke dalamnya bilah pencarian permintaan panjang, jauh lebih mudah untuk mengucapkan kata-kata dan mendapatkan hasil mesin pencari. Kami merekomendasikan mengunduh Alice Yandex di komputer Anda untuk Windows 7/10, asisten suara gratis dari Yandex dalam bahasa Rusia, menggunakan tautan di akhir ulasan.

Asisten suara Alice - serius Pesaing Siri? Saat ini, kecerdasan buatan tidak mampu bersaing dengan produk Apple. Sekali lagi, karena sebagian besar kemampuan Alice hanya sebatas berselancar di Internet. Namun perlu dipahami bahwa Siri telah ada selama bertahun-tahun dan tahap awal juga hampir tidak membawa manfaat bagi pengguna. Yandex berjanji untuk memperluas fungsionalitas “gagasannya”, tetapi mereka tidak memberi tahu kita apa sebenarnya yang diharapkan dari kecerdasan buatan. Asisten suara Unduhan Alice dari Yandex dalam bahasa Rusia Anda dapat mengikuti tautan di bawah ini.


Pemilik versi baru Yandex, yang dirancang untuk pengguna Android, menerima fungsionalitas yang diperluas. Asisten suara disebut "Alice", ia mampu melakukan banyak tugas berguna: ia akan melaporkan suhu udara saat ini, membantu Anda menemukan tempat hiburan yang sesuai, dan juga mendapatkan petunjuk arah ke sana, menjawab pertanyaan menarik menggunakan pencarian online - dan itu jauh dari itu daftar lengkap tugas yang tersedia.

Untuk mengajukan pertanyaan atau menggunakan bantuan Alice, Anda perlu menggunakan kotak dialog dengan memasukkan perintah yang diperlukan. Selain itu, pengguna dapat memuji asisten virtualnya - dan Asisten Yandex pasti akan berterima kasih kepada pemiliknya untuk ini.

Versi sistem saat ini masih memerlukan beberapa perbaikan, karena kemampuannya sangat terbatas. Namun dalam mode "Tanya-Jawab" ini berfungsi dengan sempurna - setelah meminta informasi tentang pekerjaan perusahaan yang dipilih, pengguna akan segera menerima informasi yang diperlukan. Sekalipun “Alice” tidak mengetahui jawaban pastinya, dia akan menemukan data yang diperlukan di Internet. Jika perlu, mereka juga bisa dibuka dan aplikasi pihak ketiga, yang akan membantu Anda menemukan jawaban atas pertanyaan yang diajukan.

Dalam beberapa topik, “Alice” akan dapat “memahami” apa yang dibicarakan. Misalnya saja kalian bertanya tentang cuaca, nantinya kalian bisa menggunakan berbagai kualifikasi untuk mendapatkan lebih banyak informasi rinci. Namun peluang ini tidak tersedia untuk semua topik.

Para pengembang juga berhati-hati untuk "menghidupkan kembali" asisten virtual, menjadikannya alternatif yang bagus untuk Siri dan yang populer Asisten Google. “Alice” juga siap bercanda, bahkan bisa mengutip komposisi populer jika Anda memintanya menyanyikan sebuah lagu.


Sejauh ini hanya versi uji coba yang telah diluncurkan, sehingga kesalahan mungkin saja terjadi. Asisten Yandex mengucapkan beberapa kata dengan kesalahan, mengucapkannya persis seperti yang dicetak. “Alice” membaca beberapa kalimat terlalu serius, yang juga tidak selalu tepat. Namun ini adalah versi uji coba, jadi kekurangannya cukup dimaafkan.

Saat ini sedang menguji dan antarmuka baru. Segala perubahan dan inovasi akan diketahui setelah selesainya prosedur ini. Sesuai dengan janji pengembang, versi baru asisten virtual dari Yandex akan dihadirkan kepada dunia dan tersedia untuk pengguna tahun ini.


Hari ini, 10.10.17, versi beta Yandex-Alice untuk komputer dengan OS Windows dirilis! Cara terbaik dan teraman untuk mengunduh asisten Alice untuk Windows ada di layanan Yandex, ini yang paling aman untuk Anda
  • Pembelajaran mesin,
  • Teknologi pencarian,
  • Pengembangan aplikasi seluler
  • Di masa depan, menurut kami orang akan berinteraksi dengan perangkat menggunakan suaranya. Sekarang aplikasi sudah mengenali secara pasti perintah suara, tertanam di dalamnya oleh pengembang, tetapi dengan berkembangnya teknologi kecerdasan buatan, mereka akan belajar memahami arti frasa arbitrer dan bahkan mempertahankan percakapan tentang topik apa pun. Hari ini kami akan memberi tahu pembaca Habr tentang bagaimana kami mendekatkan masa depan ini dengan menggunakan contoh Alice, asisten suara pertama yang tidak terbatas pada serangkaian jawaban yang telah ditentukan sebelumnya dan menggunakan jaringan saraf untuk komunikasi.

    Meskipun tampak sederhana, asisten suara adalah salah satu proyek teknologi terbesar Yandex. Dalam posting ini Anda akan mempelajari kesulitan apa yang dihadapi pengembang antarmuka suara siapa sebenarnya yang menulis jawabannya asisten virtual, dan apa persamaan Alice dengan kecerdasan buatan dari film “Her”.

    Pada awal keberadaannya, komputer terutama digunakan di perusahaan ilmiah atau pertahanan besar. Pada saat itu, hanya penulis fiksi ilmiah yang memikirkan tentang kontrol suara, namun kenyataannya, operator memuat program dan data menggunakan selembar karton. Bukan yang terbaik cara yang nyaman: satu kesalahan dan Anda harus memulai dari awal lagi.

    Selama bertahun-tahun, komputer menjadi lebih terjangkau dan mulai digunakan di perusahaan-perusahaan kecil. Spesialis mengendalikannya menggunakan perintah teks yang dimasukkan ke terminal. Bagus, cara yang dapat diandalkan– digunakan dalam lingkungan profesional hingga saat ini, tetapi memerlukan persiapan. Oleh karena itu, ketika komputer mulai bermunculan di rumah-rumah pengguna biasa, para insinyur mulai mencari lebih banyak cara sederhana interaksi antara mesin dan manusia.

    Konsep tersebut lahir di laboratorium Xerox GUI WIMP (Windows, Icons, Menus, Point-n-Click) - telah digunakan secara luas pada produk perusahaan lain. Tidak perlu lagi menghafal perintah teks untuk mengontrol komputer di rumah - perintah tersebut digantikan oleh gerakan dan klik mouse. Pada masanya, ini adalah revolusi yang nyata. Dan kini dunia sedang bergerak menuju masa depan.

    Sekarang hampir semua orang memiliki smartphone di sakunya, kekuatan komputasi yang cukup untuk mendaratkan kapal di bulan. Mouse dan keyboard telah menggantikan jari, namun kami masih menggunakannya untuk membuat gerakan dan klik yang sama. Hal ini nyaman dilakukan sambil duduk di sofa, tetapi tidak saat di jalan atau saat bepergian. Di masa lalu untuk berinteraksi antarmuka komputer manusia harus menguasai bahasa mesin. Kami percaya bahwa sekaranglah waktunya untuk mengajarkan perangkat dan aplikasi untuk berkomunikasi dalam bahasa manusia. Ide inilah yang menjadi dasar asisten suara Alice.

    Anda dapat bertanya kepada Alice [Di mana saya bisa mendapatkan kopi di dekat sini?] daripada mendiktekan sesuatu seperti [kedai kopi di Cosmonaut Street]. Alice akan melihat ke Yandex dan menyarankan tempat yang cocok, dan sebagai jawaban atas pertanyaan [Bagus, bagaimana menuju ke sana?] - dia akan memberikan tautan ke rute yang sudah dibangun di Yandex.Maps. Dia tahu bagaimana membedakan antara pertanyaan yang tepat tentang fakta dan keinginan untuk melihat yang klasik hasil pencarian, kekasaran - dari permintaan sopan, perintah untuk membuka situs web - dari keinginan untuk sekadar mengobrol.

    Bahkan mungkin terlihat bahwa di suatu tempat di cloud terdapat jaringan keajaiban saraf yang mampu memecahkan masalah apa pun. Namun kenyataannya, di balik setiap jawaban dari Alice terdapat serangkaian masalah teknologi, yang telah kami pelajari untuk dipecahkan selama 5 tahun. Dan kami akan memulai perjalanan kami dari tautan pertama - dengan kemampuan mendengarkan.

    Halo Alice

    Kecerdasan buatan dari fiksi ilmiah dapat mendengarkan - orang tidak perlu menekan tombol khusus untuk mengaktifkan “mode perekaman”. Dan untuk ini Anda perlu aktivasi suara– aplikasi harus memahami bahwa seseorang sedang mengaksesnya. Hal ini tidak semudah kelihatannya.

    Jika Anda baru mulai merekam dan memproses di server semua yang masuk aliran suara, maka Anda akan dengan cepat menguras baterai perangkat dan membuang semuanya lalu lintas seluler. Dalam kasus kami, masalah ini diselesaikan dengan menggunakan jaringan saraf khusus, yang dilatih khusus untuk pengenalan frase kunci(“Halo, Alice”, “Dengar, Yandex” dan beberapa lainnya). Mendukung jumlah terbatas frasa seperti itu memungkinkan Anda melakukan pekerjaan ini secara lokal dan tanpa menghubungi server.

    Jika jaringan dilatih untuk memahami hanya beberapa frasa, Anda mungkin berpikir bahwa hal itu akan cukup sederhana dan cepat. Tapi tidak. Orang-orang mengucapkan frasa dalam kondisi yang jauh dari ideal, tetapi dikelilingi oleh kebisingan yang benar-benar tidak dapat diprediksi. Dan suara setiap orang berbeda-beda. Oleh karena itu, untuk memahami satu frase saja, diperlukan ribuan rekaman pelatihan.

    Bahkan jaringan saraf lokal kecil pun menghabiskan sumber daya: Anda tidak bisa begitu saja mengambil dan mulai memproses seluruh aliran dari mikrofon. Oleh karena itu, algoritma yang tidak terlalu berat digunakan di garis depan, yang dapat mengenali peristiwa “pidato telah dimulai” dengan murah dan cepat. Inilah yang menghidupkan mesin jaringan saraf untuk mengenali frasa kunci, yang pada gilirannya menjalankan bagian tersulit - pengenalan ucapan.

    Jika ribuan contoh diperlukan untuk melatih satu frasa saja, maka Anda dapat membayangkan betapa melelahkannya melatih jaringan saraf untuk mengenali kata dan frasa apa pun. Untuk alasan yang sama, pengenalan dilakukan di cloud, tempat aliran audio ditransmisikan, dan dari mana jawaban yang sudah jadi dikembalikan. Keakuratan jawaban secara langsung bergantung pada kualitas pengenalan. Itulah sebabnya tantangan utamanya adalah belajar mengenali ucapan sebaik seseorang. Ngomong-ngomong, orang juga bisa melakukan kesalahan. Diyakini bahwa seseorang mengenali 96-98% ucapan (metrik WER). Kami berhasil mencapai akurasi 89-95%, yang tidak hanya sebanding dengan tingkat lawan bicara langsung, tetapi juga unik untuk bahasa Rusia.

    Namun ucapan yang diubah secara sempurna menjadi teks tidak akan berarti apa-apa jika kita tidak dapat memahami makna dari apa yang diucapkan.

    Bagaimana cuaca seperti besok di Sankt Peterburg?

    Jika Anda ingin aplikasi Anda menampilkan ramalan cuaca sebagai responsnya permintaan suara[cuaca], maka semuanya sederhana di sini - bandingkan teks yang dikenali dengan kata "cuaca" dan jika Anda mendapatkan kecocokan, tampilkan jawabannya. Dan ini adalah cara interaksi yang sangat primitif, karena di kehidupan nyata orang mengajukan pertanyaan secara berbeda. Seseorang dapat bertanya kepada asistennya [Bagaimana cuaca besok di St. Petersburg?], dan dia tidak akan bingung.

    Hal pertama yang dilakukan Alice ketika dia menerima pertanyaan adalah mengenali skenarionya. Kirim permintaan pencarian dan tampilkan hasil klasik dengan 10 hasil? Mencari satu jawaban yang tepat dan segera memberikannya kepada pengguna? Ambil tindakan, seperti membuka situs web? Atau mungkin sekedar ngobrol? Sangat sulit untuk mengajarkan mesin mengenali skenario perilaku secara akurat. Dan kesalahan apa pun di sini tidak menyenangkan. Untungnya kita memiliki semua kekuatan mesin pencari Yandex, yang menghadapi jutaan permintaan setiap hari, mencari jutaan jawaban dan belajar memahami mana yang baik dan mana yang tidak. Ini adalah basis pengetahuan yang sangat besar, yang atas dasar itu orang lain dapat dilatih. jaringan saraf– yang, dengan kemungkinan besar, akan “memahami” apa yang sebenarnya diinginkan seseorang. Tentu saja, kesalahan tidak bisa dihindari, namun manusia juga bisa melakukannya.

    Dengan menggunakan pembelajaran mesin Alice “memahami” bahwa frasa [Bagaimana cuaca besok di St. Petersburg?] adalah permintaan cuaca (omong-omong, ini jelas merupakan contoh sederhana untuk kejelasan). Tapi kota apa yang sedang kita bicarakan? Pada tanggal berapa? Di sinilah tahap pengambilan entitas bernama dari replika pengguna dimulai (Named Entity Recognition). Dalam kasus kami informasi penting membawa dua benda seperti itu: "Peter" dan "besok". Dan Alice, yang memiliki teknologi penelusuran di belakangnya, “memahami” bahwa “Peter” adalah sinonim untuk “St. Petersburg”, dan “besok” adalah “ tanggal saat ini+ 1".

    Bahasa alami tidak hanya itu bentuk luar replika kita, tetapi juga koherensinya. Dalam hidup, kita tidak bertukar kalimat pendek, tetapi melakukan dialog - tidak mungkin jika Anda tidak mengingat konteksnya. Alice mengingatnya - ini membantunya menangani fenomena linguistik yang kompleks: misalnya, mengatasi elipsis (memulihkan kata-kata yang hilang) atau menyelesaikan coreference (mengidentifikasi objek dengan kata ganti). Jadi, jika Anda bertanya [Di mana Elbrus?], lalu mengklarifikasi [Berapa tingginya?], maka asisten akan menemukan jawaban yang benar dalam kedua kasus tersebut. Dan jika setelah permintaan [Bagaimana cuaca hari ini?] bertanya [Dan besok?], Alice akan mengerti bahwa ini adalah kelanjutan dari dialog tentang cuaca.

    Dan sesuatu yang lain. Asisten tidak hanya harus memahami bahasa alami, tetapi juga dapat mengucapkannya - seperti manusia, bukan seperti robot. Untuk Alice, kami mensintesis suara yang aslinya milik aktris sulih suara Tatyana Shitova (suara resmi Scarlett Johansson di Rusia). Dia menyuarakan kecerdasan buatan dalam film Her, meskipun Anda mungkin juga mengingatnya dari suaranya sebagai penyihir Yennefer di The Witcher. Lebih-lebih lagi yang sedang kita bicarakan tentang sintesis yang cukup mendalam menggunakan jaringan saraf, dan bukan tentang memotong frasa yang sudah jadi - tidak mungkin untuk menuliskan semua keragamannya terlebih dahulu.

    Di atas kami telah menjelaskan ciri-ciri komunikasi alami (bentuk ucapan yang tidak dapat diprediksi, kata-kata yang hilang, kata ganti, kesalahan, kebisingan, suara), yang harus dapat Anda atasi. Namun komunikasi langsung memiliki ciri lain - kita tidak selalu menuntut jawaban atau tindakan tertentu dari lawan bicara; terkadang kita hanya ingin berbicara. Jika aplikasi mengirimkan permintaan seperti itu ke pencarian, maka semua keajaiban akan hancur. Itu sebabnya populer asisten suara gunakan database tanggapan editorial terhadap frasa dan pertanyaan populer. Tapi kami melangkah lebih jauh.

    Bagaimana dengan ngobrol?

    Kami mengajarkan mesin untuk menjawab pertanyaan kami, melakukan dialog dalam konteks skenario tertentu, dan memecahkan masalah pengguna. Ini bagus, tetapi apakah mungkin untuk membuatnya tidak terlalu berjiwa dan memberinya sifat-sifat manusia: memberinya nama, mengajarinya berbicara tentang dirinya sendiri, mempertahankan percakapan tentang topik-topik bebas?

    Industri asisten suara memecahkan masalah ini melalui tanggapan editorial. Tim Khusus Penulis mengambil ratusan pertanyaan paling populer di kalangan pengguna dan menulis beberapa kemungkinan jawaban untuk masing-masing pertanyaan. Idealnya ini harus dilakukan di gaya seragam sehingga seluruh jawaban membentuk kepribadian asisten secara utuh. Kami juga menulis jawaban untuk Alice - tetapi kami memiliki hal lain. Sesuatu yang istimewa.

    Selain bagian atas pertanyaan populer ada rangkaian frasa berfrekuensi rendah atau bahkan unik yang panjang sehingga tidak mungkin untuk mempersiapkan tanggapannya terlebih dahulu. Anda sudah menebak bagaimana kami mengatasi masalah ini, bukan? Menggunakan model jaringan saraf lain. Untuk menjawab pertanyaan dan komentar yang tidak diketahuinya, Alice menggunakan jaringan saraf yang dilatihnya basis data yang sangat besar teks dari Internet, buku dan film. Penikmat pembelajaran mesin mungkin tertarik dengan fakta bahwa kami memulai dengan jaringan saraf 3 lapis, dan sekarang kami sedang bereksperimen dengan jaringan saraf 120 lapis yang sangat besar. Kami akan menyimpan detailnya untuk postingan khusus, tetapi di sini kami akan mengatakan bahwa kami sudah melakukannya versi saat ini Alice mencoba merespons frasa sewenang-wenang menggunakan “obrolan jaringan saraf” - itulah yang kami sebut secara internal.

    Alice sedang belajar jumlah yang sangat besar paling banyak teks yang berbeda, dimana orang dan karakternya tidak selalu berperilaku sopan. Jaringan saraf dapat mempelajari sesuatu yang sangat berbeda dari apa yang ingin kita ajarkan.

    - Pesankan aku sandwich.
    - Kamu akan bertahan.

    Seperti anak lainnya, Alice tidak dapat diajari untuk tidak bersikap kasar dengan melindunginya dari semua manifestasi kekasaran dan agresi - yaitu, dengan melatih jaringan saraf dengan dasar yang "bersih", di mana sering kali tidak ada kekasaran, provokasi, dan hal-hal tidak menyenangkan lainnya. ditemukan di dunia nyata. Jika Alice tidak mengetahui keberadaan ekspresi seperti itu, dia akan menjawabnya tanpa berpikir panjang, dengan frasa acak - baginya kata-kata itu akan tetap menjadi kata-kata yang tidak diketahui. Biarkan dia mengetahui lebih baik apa masalahnya dan kembangkan posisi yang pasti mengenai isu-isu ini. Jika Anda tahu apa itu makian, Anda bisa membalas makian atau mengatakan bahwa Anda tidak akan berbicara dengan orang yang mengumpat. Dan kami mencontohkan perilaku Alice sehingga dia memilih opsi kedua.

    Kebetulan ucapan Alice itu sendiri cukup netral, namun dalam konteks yang ditentukan oleh pengguna, jawabannya tidak lagi berbahaya. Suatu kali, selama pengujian tertutup, kami meminta pengguna untuk menemukan beberapa tempat - kafe atau sejenisnya. Dia berkata: “Cari yang lain yang seperti itu.” Dan pada saat itu, bug terjadi pada Alice, dan alih-alih menjalankan skrip pencarian organisasi, dia memberikan jawaban yang agak berani - seperti “lihat peta”. Dan saya tidak mencari apa pun. Pengguna tersebut terkejut pada awalnya, dan kemudian mengejutkan kami dengan memuji perilaku Alice.

    Ketika Alice menggunakan obrolan jaringan saraf, jutaan kepribadian berbeda dapat muncul di dalamnya, karena jaringan saraf telah menyerap sedikit dari pembuat setiap replika dari set pelatihan. Tergantung pada konteksnya, Alice bisa bersikap sopan atau kasar, ceria atau depresi. Kami ingin asisten pribadi adalah kepribadian holistik dengan serangkaian kualitas yang sangat spesifik. Di sinilah teks editorial kami membantu. Keunikannya adalah awalnya ditulis atas nama kepribadian yang ingin kita ciptakan kembali di Alice. Ternyata Anda dapat terus melatih Alice pada jutaan baris teks acak, tetapi dia akan merespons dengan memperhatikan standar perilaku yang ditetapkan dalam tanggapan editorial. Dan inilah yang sedang kami kerjakan.

    Alice menjadi asisten suara pertama yang kami kenal yang mencoba menjaga komunikasi tidak hanya dengan bantuan tanggapan editorial, tetapi juga menggunakan jaringan saraf terlatih. Tentu saja kita masih sangat jauh dari apa yang digambarkan dalam fiksi ilmiah modern. Alice tidak selalu secara akurat mengenali inti dari pernyataan tersebut, yang mempengaruhi keakuratan jawabannya. Oleh karena itu, masih banyak pekerjaan yang harus kami lakukan.

    Kami berencana menjadikan Alice asisten paling humanoid di dunia. Tanamkan empati dan rasa ingin tahunya. Jadikan dia proaktif - ajari dia untuk menetapkan tujuan dalam dialog, mengambil inisiatif dan melibatkan lawan bicara dalam percakapan. Kami sekarang berada di awal perjalanan kami dan berada di garis depan ilmu pengetahuan yang mempelajari bidang ini. Untuk bergerak lebih jauh, Anda harus memindahkan tepi ini.

    Selamat siang. Rilis resmi asisten suara Alice untuk ponsel cerdas telah dilakukan, yang membuat saya senang, dan versi beta dari asisten untuk Windows juga dirilis hari ini. Saya menginstalnya, mengujinya sedikit dan terkejut.

    Asisten suara Alice untuk PC

    Untuk menginstal " Alice"di PC, Anda perlu mengunjungi situs web https://alice.yandex.ru/windows dan klik " Memasang", setelah itu kamu akan mendownload file instalasi. Luncurkan dan instal.

    PERHATIAN! Yandex telah menghapus penginstal Alice; tautan resmi sekarang mengunduh browser dengan Alice bawaan!

    Saya masih memiliki penginstalnya jika ada yang membutuhkannya —

    (tangkapan layar)

    Setelah instalasi, Anda akan melihat di kiri bawah dekat tombol Awal bilah pencarian, pada Win 10 itu terintegrasi ke dalamnya pencarian standar, di Win7 dipasang sebagai widget terpisah. Mari kita lihat apa yang bisa dilakukan asisten ini, yang masih dalam tahap Beta.

    Di tab pertama, situs yang sering dikunjungi dan berita yang sedang tren atau permintaan mesin pencari, menurut pemahaman saya:

    Di tab kedua terdapat daftar program yang dapat Anda buka dengan mengklik program itu sendiri dengan mouse, dan juga menanyakan “ Kontrol suara» buka aplikasi untuk Anda.

    Jika pada tab utama (pertama) Anda mengklik ikon “ tanda tanya “, lalu Anda akan melihat daftar kecil tentang apa yang dapat dilakukan Alice:

    Untuk ujian saya memutuskan untuk bertanya padanya berita terbaru, Apa Alice mengatakan bahwa dia memberikan kesempatan kepada rekannya dari “ Yandex.Berita", Dan suara laki-laki mulai membaca berita.

    Kemudian saya mencoba berbicara dengannya, pada prinsipnya dia menjawab sama persis seperti di telepon. Aplikasi terbuka tanpa, situs web juga. Jika Anda memintanya untuk menyalakan radio atau lagu/grup tertentu, Alice akan membuka browser, membuka Yandex.Music di dalamnya, dan meluncurkan apa yang Anda minta dia lakukan. Dia belum tahu cara bekerja dengan video.

    Untuk kontrol PC - dapat menghidupkan dan mematikan suara, mematikan, me-restart PC, dan juga mengirimnya ke mode tidur.

    Kesimpulan:

    Apa yang bisa kami katakan? Yandex melakukan pekerjaan yang baik pada asistennya. Saya harap mereka tidak meninggalkannya, tapi terus mengembangkannya. Ini bukan analog yang buruk dari Cortana, yang tidak mungkin kita lihat di Windows 10. Microsoft telah lama berjanji untuk merilisnya dalam bahasa Rusia, tetapi sejauh ini tidak didengarkan. Dan kemudian Yandex dan Alice baru saja tiba.

    Instal, coba, uji.

    Bagikan di komentar apa yang dia punya fitur menarik dan “lelucon”, apa yang dapat dilakukannya dan bagaimana hal ini sangat membantu Anda dalam pekerjaan sehari-hari dengan PC.

    • Sergei Savenkov

      semacam ulasan "pendek"... seolah-olah mereka sedang terburu-buru di suatu tempat