Panduan Menggunakan VQGAN+CLIP Untuk Gambar Clipart – Dalam tutorial ini saya akan menunjukkan cara menggunakan teknologi generasi gambar AI yang canggih VQGAN dan CLIP untuk membuat karya seni yang unik, menarik, dan dalam banyak kasus menakjubkan. Tidak diperlukan pengetahuan teknis.
Panduan Menggunakan VQGAN+CLIP Untuk Gambar Clipart
ace-clipart – Saya akan menunjukkan dua cara untuk menggunakan teknologi. Yang pertama adalah menggunakan Google Colab lingkungan pemrograman online (tidak seseram kedengarannya Anda tidak perlu tahu kode), dan yang kedua adalah menggunakan aplikasi bernama NightCafe Creator (penafian, saya membuat aplikasinya) , yang lebih cepat dan lebih mudah daripada Google Colab, tetapi pada akhirnya memerlukan pembayaran untuk penggunaan yang diperpanjang. Jangan khawatir, Anda tidak perlu membayar apa pun untuk menyelesaikan tutorial.
Pertama, intro ke VQGAN dan CLIP
Jangan ragu untuk langsung ke metode 1 atau 2 jika Anda hanya di sini untuk tutorial.
VQGAN dan CLIP sebenarnya adalah dua algoritma pembelajaran mesin terpisah yang dapat digunakan bersama untuk menghasilkan gambar berdasarkan prompt teks. VQGAN adalah jaringan saraf permusuhan generatif yang pandai menghasilkan gambar yang terlihat mirip dengan yang lain (tetapi tidak dari prompt), dan CLIP adalah jaringan saraf lain yang mampu menentukan seberapa baik keterangan (atau prompt) cocok dengan gambar.
Baca Juga : Cara Membuat ClipArt Anda Sendiri
Kedua algoritme tersebut digabungkan dalam berbagai bentuk oleh penggemar seni yang dihasilkan oleh AI seperti Ryan Murdock dan Katherine Crowson . Implementasi VQGAN+CLIP dipublikasikan di Google Colab, artinya siapa pun dapat menjalankan kode mereka untuk menghasilkan karya seni mereka sendiri. Ini segera menghasilkan ledakan viral dari orang-orang yang menggunakan teknik ini untuk membuat karya seni yang luar biasa dan membagikannya di platform seperti Twitter dan Reddit. Baca terus untuk mengetahui bagaimana melakukannya sendiri . Ingat, tidak perlu coding!
Metode 1. VQGAN+CLIP di Google Colab
Catatan: Google Colab dirancang terutama untuk diakses dari komputer. Jika Anda menggunakan ponsel, Anda mungkin harus melompat ke Metode 2. NightCafe Creator.
Jika suatu saat Anda merasa Colab terlalu rumit, langsung saja ke Metode 2. NightCafe Creator.
Google Colaboratory (biasanya disebut sebagai Colab) adalah lingkungan pemrograman berbasis cloud yang memungkinkan Anda menjalankan kode Python di server yang memiliki akses ke GPU (prosesor cepat yang awalnya dibuat untuk grafis). Bagian terakhir itu penting karena VQGAN+CLIP (dan pembelajaran mesin secara umum) membutuhkan banyak daya pemrosesan. Sedemikian rupa sehingga tidak praktis untuk menjalankannya pada CPU.
Saat Katherine Crowson pertama kali menggabungkan VQGAN dan CLIP, dia mempublikasikannya di notebook Google Colab (notebook adalah nama untuk program yang ditulis dalam Colab) sehingga siapa pun dapat menggunakannya. Implementasi aslinya telah disalin dan diubah berkali-kali sejak saat itu, jadi ada banyak versi berbeda yang dapat Anda gunakan. Berikut daftar yang disusun oleh pengguna Reddit u/Wiskkey. Untuk tutorial ini, kita akan menggunakan versi ini (silahkan buka di tab baru).Akan sangat membantu jika Anda memahami sedikit tentang cara kerja Google Colab secara umum. Ingat, Colab adalah lingkungan pemrograman online tujuan umum, tidak dibuat khusus untuk membuat seni AI, jadi ada beberapa hal yang mungkin tampak tidak perlu, dan antarmukanya agak membingungkan bagi pendatang baru.
Notebook Colab terdiri dari “sel”. Setiap sel menjalankan blok kode, dan dapat memiliki deskripsi teks. Setelah programmer menulis kode, mereka dapat menyembunyikannya dan hanya menampilkan deskripsi teks tentang apa yang dilakukan sel. Anda dapat mengeksekusi kode dalam sel dengan mengklik ikon “Mainkan”. Jadi cara Anda menjalankan notebook Colab adalah dengan menjalankan setiap sel (yaitu mengklik putar) satu demi satu. Notebook yang kami gunakan memiliki 9 sel. Ikuti petunjuk di bawah ini untuk menyelesaikan lari pertama Anda. Setiap instruksi untuk satu sel, jadi ada 9 instruksi.
- Lisensi. Sel ini tidak melakukan apa-apa, dan Anda sebenarnya tidak perlu menjalankannya.
- Sel kode dengan satu perintah nvidia-smi. Menjalankan sel ini hanya memberi Anda informasi tentang GPU yang telah ditetapkan Colab untuk Anda. Anda dapat melewatkan ini jika Anda suka.
- Sel kode yang dimulai dengan . Sel ini mengunduh dan menginstal beberapa paket kode eksternal (seperti CLIP dan kode VQGAN) yang bergantung pada sel lainnya. Anda harus menjalankan yang ini, tetapi hanya sekali per sesi. Sel ini akan memakan waktu cukup lama untuk dieksekusi karena sedang mengunduh banyak kode.!git clone https://github.com/openai/CLIP
- Sel teks dengan informasi tentang “model” (versi berbeda dari AI yang dilatih pada kumpulan data berbeda) yang dapat Anda unduh. Anda tidak dapat menjalankan sel ini, tetapi Anda harus membacanya.
- Pemilihan model untuk diunduh Sel ini memungkinkan Anda memilih model mana yang akan diunduh dengan memilih kotak centang dan kemudian mengklik tombol Putar. Anda harus menjalankan sel ini, tetapi hanya sekali per sesi kecuali jika Anda ingin mencoba model yang berbeda. Saya sarankan hanya mencentang kotak “imagenet_16384” dan kemudian mengklik Mainkan. Yang ini akan memakan waktu cukup lama, karena mengunduh file yang cukup besar.
- Muat pustaka dan variabel Sel ini hanya mengeksekusi beberapa kode di latar belakang. Jalankan dan lanjutkan.
- Pengaturan untuk proses ini Ini yang penting. Di sinilah Anda dapat menentukan prompt teks Anda dan beberapa variabel lain sebelum melakukan proses yang sebenarnya. Untuk percobaan pertama Anda, saya sarankan hanya mengatur prompt teks, mengatur lebar dan tinggi ke 400 , dan max_iterations ke 300 pengaturan ini akan memberi Anda hasil yang cukup bagus dalam waktu yang relatif singkat . Pastikan juga Anda memilih model vqgan_imagenet_f16_16384 , yang merupakan model yang Anda unduh di langkah 5. Jika Anda ingin mencoba model lain nanti, Anda harus memilihnya di langkah 5 dan menjalankan sel itu lagi terlebih dahulu untuk benar-benar mengunduhnya. Biarkan sisa opsi pada defaultnya untuk saat ini.
- Sebenarnya jalankan Ini adalah sel yang menjalankan VQGAN+CLIP dengan parameter yang Anda pilih. Ini akan mencetak beberapa informasi saat berjalan. Ini akan menjalankan algoritme untuk jumlah max_iterationsyang Anda tentukan di langkah 7, dan akan menampilkan “gambar kemajuan” setiap 50 iterasi (atau apa pun yang Anda tentukan images_intervaldi langkah 7). Ini akan memakan waktu cukup lama untuk dijalankan, karena membutuhkan banyak daya komputasi. Setelah selesai, itu hanya akan berhenti, dan gambar terakhir yang ditampilkan adalah gambar yang Anda buat. Perhatikan bahwa Anda dapat menggulir ke atas dan ke bawah di dalam sel ini untuk melihat semua gambar.
- Buat video dengan hasilnya Ini adalah langkah opsional yang dapat Anda jalankan setelah gambar Anda dibuat. Ini akan membuat video dari semua gambar
- kemajuan yang dihasilkan dalam proses menghasilkan gambar akhir Anda.
- Beberapa hal lagi yang perlu diketahui
- Setelah Anda menjalankan semua sel sekali, untuk membuat sesuatu yang baru, Anda hanya perlu menjalankan sel 7 dan 8 lagi (dan 9 jika Anda menginginkan video). Namun, jika Anda ingin mencoba memilih model yang berbeda di sel 7, Anda harus terlebih dahulu mencentang kotak yang sesuai di sel 5, lalu menjalankan sel itu lagi.
Notebook memungkinkan Anda untuk (opsional) menggunakan gambar “mulai” dan “target”. Gambar awal akan menginisialisasi algoritme dengan gambar Anda (bukan piksel acak) dan gambar target akan bertindak sebagai perintah lain dalam bentuk gambar, mengarahkan algoritme ke output yang terlihat seperti target. Untuk menggunakan gambar awal dan target di sel 7, pertama-tama Anda harus mengklik tab “file” (ikon folder) di bilah sisi kiri, lalu ikon “unggah ke penyimpanan sesi”. Anda dapat mengunggah gambar di sini, lalu memasukkan nama filenya ke dalam parameter “gambar awal” atau “gambar target” di sel 7.