Apakah Jukebox OpenAI?

Apakah Jukebox Openai



Jukebox OpenAI ialah rangkaian saraf yang boleh menjana lirik dan muzik dalam pelbagai gaya serta genre. Ia juga boleh mengadun semula lagu sedia ada atau mencipta lagu baharu dari awal. Jukebox dikuasakan oleh model pengubah berskala besar yang telah dilatih mengenai berjuta-juta lagu dan lirik daripada web.

Siaran ini akan menerangkan kandungan berikut:

Apakah Jukebox OpenAI?

Jukebox ialah sistem pembelajaran mendalam yang boleh menjana muzik dari awal, diberikan beberapa input seperti lirik, genre, artis atau mood. Jukebox menggunakan set data besar lebih 1.2 juta lagu daripada pelbagai sumber, seperti Spotify, YouTube dan fail MIDI, untuk mempelajari corak dan ciri muzik.









Bagaimanakah Jukebox OpenAI Berfungsi?

Jukebox terdiri daripada tiga komponen utama: pengekod VQ-VAE, penyahkod transformer dan upsampler.



Pengekod VQ-VAE

Pengekod VQ-VAE bertanggungjawab untuk memampatkan audio mentah ke dalam perwakilan dimensi lebih rendah yang mengekalkan maklumat penting muzik. Pengekod menggunakan teknik yang dipanggil pengkuantitian vektor (VQ) untuk memetakan setiap segmen audio ke dalam salah satu daripada 2048 token.





Penyahkod pengubah

Token ini kemudiannya dimasukkan ke dalam penyahkod transformer, iaitu rangkaian saraf yang boleh menjana urutan token berdasarkan input dan pengetahuan muzik yang dipelajari. Penyahkod boleh menjana token yang sepadan dengan lirik, melodi, harmoni, irama, timbre dan aspek muzik lain.

Upsampler

Upsampler ialah komponen terakhir yang menukar token yang dijana kembali kepada audio berkualiti tinggi. Upsampler menggunakan VQ-VAE lain untuk membina semula audio daripada token sambil menambah butiran dan nuansa yang tiada dalam perwakilan dimensi rendah. Upsampler juga boleh menggunakan maklumat tambahan seperti genre atau benam artis untuk memperhalusi output dan menjadikannya lebih realistik dan pelbagai.



Bagaimana untuk Menggunakan Kotak Juke OpenAI?

Untuk menggunakan Jukebox, anda perlu mempunyai akses kepada GPU berkuasa atau perkhidmatan pengkomputeran awan yang boleh menjalankan kod Jukebox. Anda boleh menemui skrip dan arahan tentang cara memasang dan menjalankan Jukebox GitHub . Anda juga boleh menemui beberapa contoh lagu yang dijana oleh Jukebox pada SoundCloud di bawah:

Untuk menjana lagu anda sendiri dengan Jukebox, anda perlu menyediakan beberapa parameter input seperti lirik, genre, artis atau mood. Anda juga boleh menentukan suhu pensampelan, yang mengawal tahap rawak dan kreatif output itu.

Suhu yang lebih tinggi bermakna lebih banyak kepelbagaian dan kebaharuan, manakala suhu yang lebih rendah bermakna lebih koheren dan persamaan dengan input. Anda juga boleh memilih tahap kualiti dan kerumitan output, antara 5b (paling tinggi) hingga 1b (paling rendah). Tahap yang lebih tinggi bermakna lebih setia dan terperinci, tetapi juga lebih banyak masa dan sumber pengiraan.

Sebaik sahaja anda telah menyediakan parameter input anda, anda boleh menjalankan kod Jukebox dan tunggu sehingga ia menjana lagu anda. Bergantung pada tetapan dan perkakasan anda, ini mungkin mengambil masa dari beberapa minit ke jam atau bahkan beberapa hari. Selain itu, pantau kemajuan dan dengarkan sampel perantaraan di sepanjang jalan. Apabila penjanaan selesai, anda boleh memuat turun lagu anda sebagai fail MP3 dan menikmati karya muzik anda.

Ciri-ciri Jukebox

Kotak juke boleh digunakan untuk pelbagai tujuan, seperti:

  • Mencipta muzik asli untuk kegunaan peribadi atau komersial
  • Remix atau pensampelan lagu sedia ada
  • Menjana muzik untuk mood, tema atau majlis tertentu
  • Meneroka genre dan gaya muzik yang berbeza
  • Berseronok dan kreatif

Kesimpulan

Jukebox ialah alat hebat yang boleh membantu anda mencipta muzik asli dan pelbagai dengan usaha yang minimum. Anda boleh menggunakannya untuk bereksperimen dengan genre dan gaya yang berbeza, untuk mengadun semula lagu atau artis sedia ada, atau untuk meluahkan emosi dan idea anda sendiri melalui muzik. Jukebox tidak sempurna walaupun; kadangkala ia mungkin menghasilkan gangguan, ralat atau output yang tidak masuk akal.