NEW YORK: Ketika orang ramai bersiap sedia untuk menghadapi kesan gangguan kecerdasan buatan terhadap pekerjaan dan kehidupan seharian, mereka yang berada dalam dunia buku audio berkata bidang mereka sudahpun berubah.
AI mempunyai keupayaan untuk mencipta rakaman bunyi manusia – pada kelajuan talian pemasangan – sambil memintas sekurang-kurangnya sebahagian daripada perkhidmatan profesional manusia yang selama bertahun-tahun mencari rezeki dengan suara mereka.
Ramai daripada mereka sudah melihat kejatuhan mendadak dalam perniagaan.
Tanya Eby telah menjadi pelakon suara sepenuh masa dan pencerita profesional selama 20 tahun. Dia mempunyai studio rakaman di rumahnya.
Tetapi dalam enam bulan lalu dia telah melihat beban kerjanya berkurangan separuh. Tempahannya kini hanya berlangsung hingga Jun, manakala dalam tahun biasa ia akan dilanjutkan hingga Ogos.
Ramai rakan sekerjanya melaporkan penurunan yang sama.
Walaupun faktor lain boleh bermain, dia memberitahu AFP, “Nampaknya masuk akal bahawa AI mempengaruhi kita semua.”
Tiada label yang mengenal pasti rakaman berbantukan AI seperti itu, tetapi para profesional mengatakan beribu-ribu buku audio yang sedang dalam edaran menggunakan “suara” yang dijana daripada bank data.
Antara yang paling canggih, DeepZen menawarkan kadar yang boleh mengurangkan kos menghasilkan buku audio kepada satu perempat, atau kurang, kos projek tradisional.
Syarikat kecil yang berpangkalan di London itu mengambil daripada pangkalan data yang diciptanya dengan merakam suara beberapa pelakon yang diminta bercakap dalam pelbagai daftar emosi.
“Setiap suara yang kami gunakan, kami menandatangani perjanjian lesen, dan kami membayar untuk rakaman itu,” kata Ketua Pegawai Eksekutif DeepZen, Kamis Taylan.
Bagi setiap projek, tambahnya, “kami membayar royalti berdasarkan kerja yang kami lakukan.”
Tidak semua orang menghormati standard itu, kata Eby.
“Semua syarikat baharu ini muncul yang tidak beretika,” katanya, dan ada yang menggunakan suara yang terdapat dalam pangkalan data tanpa membayarnya.
“Ada kawasan kelabu itu” yang dieksploitasi oleh beberapa platform, Taylan mengakui.
“Mereka mengambil suara anda, suara saya, lima suara orang lain digabungkan yang hanya mencipta suara yang berasingan… Mereka mengatakan bahawa ia bukan milik sesiapa.”
Semua syarikat buku audio yang dihubungi AFP menafikan menggunakan amalan sedemikian.
Speechki, syarikat permulaan yang berpangkalan di Texas, menggunakan kedua-dua rakaman dan suaranya sendiri daripada bank data sedia ada, kata Ketua Pegawai Eksekutif Dima Abramov.
Tetapi itu dilakukan hanya selepas kontrak ditandatangani meliputi hak penggunaan, katanya.
Masa depan kewujudan bersama?
Lima rumah penerbitan AS terbesar tidak menjawab permintaan untuk komen.
Tetapi profesional yang dihubungi AFP berkata beberapa penerbit tradisional sudah menggunakan apa yang dipanggil AI generatif, yang boleh mencipta teks, imej, video dan suara daripada kandungan sedia ada – tanpa campur tangan manusia.
“Penceritaan profesional sentiasa, dan akan kekal, teras kepada pengalaman mendengar Audible,” kata jurucakap anak syarikat Amazon itu, sebuah gergasi dalam sektor buku audio Amerika.
“Walau bagaimanapun, apabila teknologi teks ke pertuturan bertambah baik, kami melihat masa depan di mana persembahan manusia dan kandungan yang dihasilkan teks ke pertuturan boleh wujud bersama.”
Gergasi teknologi AS, yang terlibat secara mendalam dalam bidang AI yang sedang berkembang pesat, semuanya mengejar perniagaan menjanjikan buku audio yang dikisahkan secara digital.
‘Boleh diakses oleh semua’
Awal tahun ini, Apple mengumumkan ia akan beralih ke buku audio yang dikisahkan AI, satu langkah yang dikatakan akan menjadikan “penciptaan buku audio lebih mudah diakses oleh semua,” terutamanya pengarang bebas dan penerbit kecil.
Google menawarkan perkhidmatan serupa, yang disifatkannya sebagai “auto-narasi.”
“Kita perlu mendemokrasikan industri penerbitan, kerana hanya nama yang paling terkenal dan besar akan ditukar menjadi audio,” kata Taylan.
“Penceritaan sintetik hanya membuka pintu untuk buku lama yang tidak pernah direkodkan, dan semua buku dari masa depan yang tidak akan pernah direkodkan kerana ekonomi,” tambah Abramov dari Speechki.
Memandangkan kos rakaman berasaskan manusia, tambahnya, hanya kira-kira lima peratus daripada semua buku dijadikan buku audio.
Tetapi Abramov menegaskan bahawa pasaran yang semakin meningkat juga akan memberi manfaat kepada pelakon suara.
“Mereka akan membuat lebih banyak wang, mereka akan membuat lebih banyak rakaman,” katanya.
Unsur manusia
“Intipati bercerita adalah mengajar manusia bagaimana menjadi manusia. Dan kami berasa kuat bahawa perkara itu tidak boleh diberikan kepada mesin untuk mengajar kami tentang cara menjadi manusia,” kata Emily Ellet, seorang pelakon dan narator buku audio yang mengasaskan Professional Persatuan Pencerita Buku Audio (PANA).
“Bercerita,” tambahnya, “harus kekal sebagai manusia sepenuhnya.”
Eby menggariskan kritikan yang kerap terhadap rakaman yang dihasilkan secara digital.
Jika dibandingkan dengan rakaman manusia, dia berkata, produk AI “tidak mempunyai hubungan emosi.”
Eby berkata dia bimbang, bagaimanapun, bahawa orang akan membiasakan diri dengan versi yang dihasilkan mesin, “dan saya rasa itu secara senyap-senyap apa yang berlaku.”
Hasratnya ialah “syarikat akan memberitahu pendengar bahawa mereka sedang mendengar karya yang dijana AI… Saya hanya mahu orang ramai jujur mengenainya.” – AFP