Generator Gambar AI Terbaik di tahun 2023

Generator Gambar AI Terbaik di tahun 2023 – Pada awal tahun 2022, hampir tidak ada generator teks-ke-gambar AI yang tersedia untuk umum, tetapi dengan DALL-E akhirnya tersedia dalam versi beta pada bulan Juli dan Difusi Stabil dirilis sebulan kemudian, sekarang tiba-tiba ada serangkaian Generator gambar AI berlomba-lomba untuk menjadi perangkat lunak terbaik di pasar.

Generator Gambar AI Terbaik di tahun 2023

mypicpals.com – Jadi jika Anda merasa bingung tentang generator Gambar AI mana yang harus Anda gunakan di tahun 2023, ini adalah panduan lengkap untuk pilihan terbaik yang ada.

DALL-E 2

Sebuah produk dari laboratorium penelitian yang didirikan Elon Musk OpenAI , DALL-E 2 , yang akan kami sebut sebagai DALL-E saja, adalah perangkat lunak yang dapat disebutkan oleh kebanyakan orang ketika Anda bertanya kepada mereka tentang generator teks-ke-gambar AI.

Saat diluncurkan pada bulan April , DALL-E mengejutkan media sosial dengan kemampuannya mengubah deskripsi singkat menjadi gambar foto-realistis.

Baca Juga : 10 Aplikasi Slideshow Terbaik untuk Android 

Untuk beberapa orang dengan akses istimewa ke alat tertutup, DALL-E sangat luar biasa sehingga hampir terasa seperti sihir — apakah itu melibatkan menghasilkan gambar “astronot rakun dengan kosmos yang terpantul di kaca helmnya” atau ” boneka beruang berbelanja bahan makanan di Mesir Kuno, ”semuanya dari permintaan teks sederhana.

Sejak itu, DALL-E telah mendapatkan reputasi sebagai pembuat teks-ke-gambar AI terkemuka yang tersedia. Dikenal untuk menghasilkan hasil terbaik dan menjadi salah satu sistem termudah untuk digunakan.

DALL-E bukanlah satu-satunya perangkat lunak pembelajaran mesin yang dapat menghasilkan gambar. Jadi apa yang ada di balik reputasi AI generator yang tak tertandingi? Dan mengapa teknologinya dianggap sangat inovatif dan mengganggu?

Pertama-tama, fakta bahwa gambar yang DALL-E buat menarik secara visual adalah komponen kunci keberhasilannya. Sementara pembuat gambar AI lainnya sering menghasilkan karya seni yang memiliki nada apokaliptik atau lebih gelap, Dall-E menciptakan gambar yang sangat realistis dan jauh lebih estetis bagi pencipta yang sudah memiliki selera artistik yang tajam.

Saat DALL-E hadir, ini merupakan langkah maju yang besar dalam teknologi pembuatan gambar AI. Dibandingkan dengan pendahulunya, perangkat lunak ini adalah yang pertama yang memungkinkan pengguna memiliki tingkat kontrol yang luar biasa atas gaya, subjek, dan atribut gambar digital yang mereka buat, bahkan membiarkan pengguna mengontrol lensa dan apertur dalam “foto” buatan AI mereka . ”. Teknologi ini tampaknya memungkinkan kemungkinan tak terbatas dalam hal pembuatan gambar.

DALL-E juga mengejutkan pengguna dengan kemampuannya yang luar biasa untuk memahami petunjuk teks lebih baik daripada perangkat lunak lain yang mendahuluinya. Ini karena fakta bahwa DALL-E menggunakan GPT-3 yang dimiliki OpenAI — bisa dibilang algoritme pembelajaran mesin bahasa alami paling canggih — untuk mengonversi instruksi berbasis teks menjadi gambar.

Jadi bagaimana Anda bisa menggunakan DALL-E? Selain menggunakannya untuk mengubah kalimat menjadi gambar, Anda juga dapat meminta DALL-E dengan gambar. Ada dua cara untuk melakukannya: variasi atau edit.

Variasi hanya meminta DALL-E dengan gambar, bukan teks tertulis. Menanggapi gambar yang diberikan, DALL-E menghasilkan serangkaian gambar tambahan, yang mencerminkan estetika dan subjek aslinya, tetapi setiap gambar memiliki sentuhannya sendiri.

Pengeditan adalah cara ketiga untuk mengaktifkan DALL-E dan mungkin merupakan salah satu fitur perangkat lunak yang paling revolusioner. Anda dapat memberikan gambar dan meminta DALL-E untuk menambahkan “bayi gajah mandi” ke dalam foto air, menajamkan kepik yang tidak fokus , menghapus objek dalam gambar, atau “membuatnya menjadi malam hari”. Teknologi AI bahkan memahami hal-hal seperti pantulan dan akan memperbaruinya saat mengedit.

DALL-E hanya menghasilkan output persegi. Tetapi dengan menggunakan fitur pengeditan baru “Outpainting” , Anda dapat memperluas gambar melampaui batas aslinya.

Outpainting memungkinkan pengguna memperluas gambar ke luar ke bingkai tampilan yang lebih luas, membuat gambar lebih besar dalam rasio aspek apa pun. Dengan memasukkan prompt ke DALL-E, mesin akan mempertimbangkan elemen visual gambar yang ada untuk mempertahankan konteks gambar aslinya. Ia menggunakan bayangan, pantulan, dan tekstur untuk menciptakan latar belakang AI yang dirancang agar berpadu sempurna dengan gambar aslinya.

Kemampuan luar biasa ini membuat DALL-E terasa seperti alat pengeditan yang kuat dan penting bagi fotografer di masa mendatang.

Sistem DALL-E 2 generasi kedua OpenAI baru-baru ini tersedia untuk umum dan siapa pun sekarang dapat membuat akun .

Setiap akun DALL-E 2 menerima 50 kredit gratis untuk digunakan pada sistem dan 15 kredit tambahan setiap bulan. Kredit tambahan akan dikenakan biaya $15 per 115 kredit, dan setiap kredit akan mengembalikan empat gambar untuk prompt atau instruksi.

OpenAI secara eksplisit mengatakan pengguna “mendapatkan hak penuh untuk mengkomersialkan gambar yang mereka buat dengan DALL-E, termasuk hak untuk mencetak ulang, menjual, dan memperdagangkan,” meskipun diakui ini masih merupakan area abu-abu legal. Perusahaan telah merancang DALL-E 2 untuk menolak membuat gambar selebritas atau figur publik. Sistem juga tidak akan menghasilkan konten eksplisit, berdarah, atau politis.

Dianggap sebagai salah satu platform paling menggugah untuk pembuatan gambar AI, Midjourney menjadi berita utama ketika salah satu penggunanya memenangkan kompetisi seni rupa menggunakan gambar yang dia buat dengan perangkat lunak tersebut .

Uniknya, Midjourney dioperasikan melalui server Discord dan menggunakan perintah bot Discord untuk menghasilkan gambar berkualitas tinggi dengan gaya yang sangat artistik. Pengguna dapat memasukkan prompt teks untuk membuat gambar yang jelas dan menakjubkan yang tampaknya selalu memiliki kualitas apokaliptik atau menakutkan bagi mereka.

Berbeda dengan DALL-E, Midjourney akan menghasilkan foto-foto selebritas dan figur publik . Pengguna Discord sering menggunakan perangkat lunak untuk secara imajinatif memvisualisasikan aktor favorit mereka dalam peran film tertentu.

Salah satu kelemahan Midjourney yang mungkin adalah bahwa perangkat lunak ini sangat bergaya sebagai generator teks-ke-gambar AI dan mungkin sulit untuk membuat gambar fotorealistik.

Pendiri Midjourney David Holz mengatakan bahwa sistem tersebut tidak pernah dirancang untuk menciptakan citra yang terlihat realistis dan ini adalah bagian penting dari filosofi Midjourney sebagai generator AI.

“Kami memiliki gaya dan tampilan default, dan itu artistik dan indah, dan sulit untuk mendorong [model] menjauh dari itu,” kata Holz kepada The Verge . “Mungkin jika Anda menghabiskan 100 jam mencoba, Anda dapat menemukan kombinasi kata yang tepat yang membuatnya terlihat sangat realistis, tetapi Anda harus bekerja keras untuk membuatnya terlihat seperti foto.”

“Kami fokus untuk membuat segala sesuatu terlihat indah dan artistik,” tambah Holz.

Namun beberapa pengguna Midjourney telah membuktikan bahwa membuat gambar ultra fotorealistis pada perangkat lunak dapat dilakukan dengan pengetahuan lanjutan tentang petunjuk teks yang diperlukan.

Jika ada satu kelemahan Midjourney, itu adalah Anda harus menggunakan server Discord untuk menempatkan prompt teks yang mungkin sulit dipahami pada awalnya. Antarmuka Discord juga bisa membuat frustasi untuk digunakan dan Anda mungkin sering menemukan seni AI Anda sendiri hilang di antara segudang kueri buatan pengguna lainnya di suatu saluran.

Namun menurut Holz, ini selalu disengaja karena Midjourney dimaksudkan sebagai “pengalaman sosial”. Dan pasti menarik melihat karya seni pengguna lain saat Anda menunggu gambar Anda dimuat di Midjourney.

Jadi bagaimana Anda menggunakan Midjourney? Platform Midjourney dibuka untuk semua sebagai versi beta pada bulan Juli. Setelah Anda bergabung dengan server Midjourney Discord, generator AI dapat digunakan di antarmuka web Discord atau di aplikasi Discord.

Untuk menghasilkan karya seni di Midjourney, Anda harus membuka saluran di Discord, misalnya #newbies-126.

Dari sana, Anda mengetikkan perintah Bot “/imagine” di saluran Discord. Perintah ini secara otomatis akan menghasilkan teks “prompt:”. Ini adalah saat Anda mendeskripsikan apa yang ingin Anda lihat sebagai gambar.

Anda perlu mengetikkan kata kunci untuk gambar Anda setelah teks “prompt:” atau perintah tidak akan berfungsi. Kemudian, Anda menekan kembali dan menunggu karya seni Anda dibuat.

Jadi misalnya Anda bisa mengetik “Hamster pemakan pizza di pantai Hawaii” dan setelah sekitar satu menit, gambar Anda akan dibuat di antara permintaan pengguna lainnya.

Tiga aturan server Midjourney saat membuat karya seni adalah “jangan brengsek, jangan gunakan bot untuk membuat konten yang tidak pantas, dan hormati semua orang”.

25 gambar pertama di Midjourney gratis, lalu paket dasarnya adalah $10 per bulan untuk 200 gambar. Ada juga keanggotaan standar $30 per bulan untuk penggunaan tak terbatas. Midjourney akan mengizinkan perusahaan menggunakan gambar yang dihasilkan untuk keanggotaan perusahaan khusus sebesar $600 per tahun. Kalau tidak, gambar itu milik Anda.

Difusi Stabil

Meskipun Anda mungkin harus menunggu lama untuk mendapatkan akses ke DALL-E 2, ada generator teks-ke-gambar AI yang mendapat nilai tertinggi untuk aksesibilitas, dan itu adalah Difusi Stabil .

Dikembangkan oleh StabilityAI , bekerja sama dengan EleutherAI dan LAION , Stable Diffusion adalah generator gambar AI yang sangat baik bagi mereka yang ingin mulai membuat seni digital mereka sendiri sekarang.

Apa yang membuat Stable Diffusion istimewa adalah transparansi Stability AI dengan perangkat lunaknya. Perusahaan telah membuat kode sumber Stable Diffusion tersedia secara terbuka di bawah lisensi Creative ML OpenRAIL-M. Ini sangat kontras dengan model pesaing seperti DALL-E misalnya.

Karena Stable Diffusion adalah open source, pengguna sudah mulai meningkatkan dan membuat kode asli. Ada lusinan repositori dengan berbagai fitur dan pengoptimalan. Pengguna Reddit bahkan berhasil membuat plug-in Photoshop untuk Stable Diffusion. Ada juga plug-in yang tersedia untuk Krita .

Komunitas dan inovasi seputar Stable Diffusion inilah yang membuat pembuat gambar AI begitu menarik bagi pengguna, meskipun memang sulit untuk menavigasi di antara berbagai repositori yang tersedia secara online.

Jika Anda mencari Difusi Stabil yang asli, Anda dapat menjalankan perangkat lunak di komputer Anda atau Anda dapat mengakses versi beta dari antarmuka Web di Dream Studio . Saat pengguna mendaftar ke DreamStudio, mereka akan diberikan 200 kredit untuk digunakan di Stable Diffusion tetapi setelah itu, £1 ($1,18) akan membeli 100 generasi. Sementara itu, £100 (~$118) akan membeli 10.000 generasi.

Versi beta Difusi Stabil dapat menghasilkan gambar fotorealistik 512×512 piksel. Seperti halnya DALL-E, Anda dapat mengetikkan prompt teks dan sistem akan menghasilkan gambar. Selain itu, dapat menghasilkan karya seni fotorealistik menggunakan gambar yang diunggah dikombinasikan dengan deskripsi tertulis.

Untuk melatih model Stable Diffusion, Stability AI menggunakan 4.000 GPU Nvidia A100 dan varian set data LAION-5B. Oleh karena itu, Difusi Stabil mampu menghasilkan gambar selebritas , karakter kartun , dan figur publik yang sangat kreatif yang tidak diizinkan oleh OpenAI dengan DALL-E 2.

Kualitas gambar yang dihasilkan dalam Stable Diffusion tampaknya bisa sangat mengesankan. Dalam postingan Reddit yang sekarang viral , seorang pengguna mengklaim telah menggunakan prompt teks yang dikombinasikan dengan sketsa untuk menghasilkan gambar hiper-realistis dari kota metropolis futuristik.

Generator Gambar AI Terbaik di tahun 2023
Scroll to top