OpenAI Dall-e 2
DigitalFutureSoft (Jakarta) – DALL-E, DALL-E 2, dan DALL-E 3 (ditulis DALL·E dan diucapkan DOLL-E) adalah model teks-ke-gambar yang dikembangkan oleh OpenAI dengan menggunakan metodologi pembelajaran mendalam untuk menghasilkan gambar digital dari deskripsi bahasa alami yang dikenal sebagai prompt.
Versi pertama DALL-E diumumkan pada Januari 2021. Setahun kemudian, penerusnya, DALL-E 2, dirilis. DALL-E 3 diluncurkan secara resmi dalam ChatGPT untuk pelanggan ChatGPT Plus dan ChatGPT Enterprise pada Oktober 2023, dengan ketersediaan melalui API OpenAI dan platform “Labs” yang disediakan pada awal November. Microsoft juga telah menerapkan model ini dalam alat Pencipta Gambar Bing dan berencana untuk mengintegrasikannya ke dalam aplikasi Designer mereka.
Table of Contents
Apakah OpenAI Dall-e 2

DALL-E 2 adalah sistem AI terbaru dan penerus dari DALL-E yang pertama kali diluncurkan oleh OpenAI pada Januari 2021. Versi baru dari program ini mampu menghasilkan gambar dan seni yang realistis dan berkualitas tinggi hanya berdasarkan teks deskriptif yang dimasukkan oleh pengguna, dengan resolusi hingga 4 kali lebih tinggi dibandingkan teknologi sebelumnya. Selain itu, DALL-E 2 juga dapat memanipulasi gambar yang sudah ada untuk menambahkan elemen baru yang menarik. Editan yang realistis ini sama mengesankannya dengan gambar yang dihasilkan sepenuhnya.
Nama DALL-E merupakan gabungan dari seniman surealis Spanyol yang terkenal, Salvador Dalí, dan robot kubik lucu dari Pixar, WALL-E.
OpenAI, pencipta DALL-E dan DALL-E 2, adalah laboratorium penelitian kecerdasan buatan yang didirikan pada tahun 2015. Organisasi ini berada di bawah perusahaan yang berorientasi laba, OpenAI LP, serta perusahaan induk nirlaba, OpenAI Inc.
Tim OpenAI berharap bahwa “DALL-E 2 akan memberdayakan orang untuk mengekspresikan diri secara kreatif. DALL-E 2 juga membantu kita memahami bagaimana sistem AI yang canggih melihat dan memahami dunia kita, yang sangat penting untuk misi kami dalam menciptakan AI yang bermanfaat bagi umat manusia.”
Platform DALL-E 2 adalah model generasi gambar canggih yang dikembangkan oleh OpenAI. Mengandalkan keberhasilan DALL-E yang asli, versi terbaru ini mengubah deskripsi teks menjadi gambar yang menakjubkan secara visual.
Model ini menggunakan kecerdasan buatan untuk menciptakan gambar berkualitas tinggi dari perintah teks. Fitur-fitur canggihnya, seperti inpainting dan kemampuan generasi gambar yang fleksibel, mengubah cara kita membuat konten visual.
Sebagai model generasi gambar yang lebih maju, DALL-E 2 mampu mengubah deskripsi teks menjadi gambar berkualitas tinggi dengan kreativitas yang luar biasa. OpenAI Dall-e 2 merupakan kemajuan signifikan dari pendahulunya, menawarkan resolusi yang lebih baik dan kemampuan pengeditan yang lebih lengkap. Memahami DALL-E 2 sangat penting untuk memanfaatkan potensinya di berbagai bidang, mulai dari pemasaran hingga proyek pribadi.
Fitur Utama

OpenAI Dall-e 2 ini merupakan Solusi Digital Masa Depan ini menyediakan berbagai fitur inovatif yang meningkatkan kemampuannya dalam menciptakan dan memodifikasi gambar berdasarkan deskripsi teks. Model ini menonjol karena hasilnya yang berkualitas tinggi dan fleksibilitasnya, menjadikannya alat yang berharga untuk berbagai aplikasi kreatif dan profesional. Berikut adalah beberapa fitur utama yang mendefinisikan DALL-E 2:
Generasi Gambar Resolusi Tinggi
Teknologi ini menghasilkan gambar dengan resolusi dan detail yang jauh lebih baik dibandingkan pendahulunya. Hal ini memungkinkan representasi visual dari teks yang lebih jelas dan rumit.
Kreativitas dan Fleksibilitas yang Ditingkatkan
Model ini mampu menciptakan gambar yang beragam dan imajinatif dari berbagai masukan teks. Baik itu menggabungkan konsep yang tidak biasa atau menciptakan visual baru, ia unggul dalam menghasilkan konten yang unik dan kreatif.
Kemampuan Inpainting yang Canggih
Pengguna dapat mengedit gambar yang ada dengan tepat melalui instruksi teks. Fitur ini memungkinkan penambahan atau penghapusan elemen, sehingga memudahkan dalam memperbaiki dan menyesuaikan gambar tanpa harus memulai dari awal.
Peningkatan Kesesuaian Teks ke Gambar
DALL-E 2 menunjukkan pemahaman yang lebih baik terhadap deskripsi teks yang kompleks dan nuansa, menghasilkan gambar yang lebih akurat dan relevan secara kontekstual. Peningkatan ini memastikan bahwa visual yang dihasilkan sangat sesuai dengan permintaan yang diberikan.
Aplikasi yang Serbaguna
Dari menciptakan visual pemasaran hingga menghasilkan seni konsep, kemampuan DALL-E 2 dapat disesuaikan dengan berbagai industri dan proyek kreatif, menawarkan alat yang kuat untuk penggunaan pribadi dan profesional.
Fitur-fitur ini secara keseluruhan menempatkannya sebagai alat mutakhir dalam generasi gambar, memberikan pengguna peluang yang belum pernah ada sebelumnya untuk kreativitas dan inovasi visual.
Kecepatan
Dall-E mampu menghasilkan gambar dalam waktu singkat, seringkali kurang dari satu menit. Seorang pengguna dapat menciptakan gambar yang detail dan berkualitas tinggi hanya dengan satu perintah teks.
Kustomisasi
Dengan perintah teks yang tepat, pengguna dapat membuat gambar yang sangat disesuaikan dari hampir semua yang bisa dibayangkan — meskipun ada batasan pada konten dewasa, kekerasan, atau kebencian.
Aksesibilitas
Karena Dall-E 3 dapat diakses melalui ChatGPT dengan menggunakan bahasa alami, Dall-E tersedia untuk berbagai pengguna. Tidak diperlukan pelatihan yang mendalam atau keterampilan pemrograman khusus.
Penyempurnaan
Pengguna dapat menyempurnakan gambar melalui perintah berikutnya dalam sesi obrolan yang sama dengan perintah awal. Pengguna juga dapat menggunakan perintah yang dihasilkan oleh Dall-E saat memulai sesi obrolan baru. Dall-E juga memberikan saran perintah untuk menyempurnakan gambar setelah menciptakan gambar awal.
Fleksibilitas
Dall-E dapat menganalisis gambar yang diajukan oleh pengguna dan, dari situ, menghasilkan gambar baru berdasarkan perintah pengguna.
Harga

Sebelumnya, DALL-E dapat digunakan secara gratis oleh orang-orang yang telah diberikan akses oleh OpenAI. Pengguna ini berhak mendapatkan 50 generasi gratis setiap hari, dan mereka memanfaatkan AI pembuat gambar dari teks ini untuk menciptakan karya seni seperti papan suasana untuk restoran, video musik, rendering 3D, desain produk, dan sampul majalah.
Namun, pada 20 Juli 2022, OpenAI mengumumkan peluncuran beta DALL-E 2, bersamaan dengan model harga baru. Setiap pengguna DALL·E 2 akan menerima 50 kredit gratis untuk bulan pertama penggunaan, dan kemudian 15 kredit gratis setiap bulan setelahnya. Setiap kredit dapat digunakan untuk mengirimkan permintaan teks ke AI, yang akan mengembalikan empat gambar sekaligus. (Untuk pengeditan dan variasi, tiga gambar akan dikembalikan sekaligus.)
Namun, di sinilah menjadi rumit — untuk mendapatkan kredit tambahan, pengguna harus membelinya. Dengan $15, Anda akan mendapatkan 115 kredit. Anda dapat membeli paket kredit lain sebanyak 115 kredit seharga $15 jika Anda telah menghabiskannya.
Setelah pengumuman model harga DALL-E 2, banyak pendapat yang muncul dari internet dan akun KONOHATOTO78. Beberapa orang mengungkapkan ketidakpuasan, sementara yang lain menunjukkan dukungan. Mari kita lihat beberapa pendapat dan kekhawatiran yang disampaikan oleh pengguna mengenai OpenAI Dall-e 2:
- “Jika dibandingkan dengan tarif yang dikenakan oleh seniman profesional untuk waktu dan keahlian mereka, $15 untuk 115 permintaan tidak terasa mahal sama sekali.”
- Pengguna diharapkan untuk membeli minimal 5.750 kredit (senilai $750) sekaligus, yang berarti tidak bisa memulai dengan hanya membeli 115 kredit.
- Seringkali, pengguna perlu mencoba beberapa kali sebelum mendapatkan gambar yang diinginkan. Bagaimana jika kredit habis sebelum gambar yang sempurna dihasilkan?
- Beberapa juga merasa tidak senang dengan kenyataan bahwa kredit berbayar memiliki tanggal kedaluwarsa.
Model OpenAI o1
Model penalaran frontier yang mendukung alat, keluaran terstruktur, dan visi | panjang konteks 200k
- Input: $15,00 / 1M token
- Input yang disimpan: $7,50 / 1M token
- Keluaran: $60,00 / 1M token
Model OpenAI o3-mini
Model penalaran kecil yang efisien biaya, dioptimalkan untuk pemrograman, matematika, dan sains, serta mendukung alat dan keluaran terstruktur | panjang konteks 200k
- Input: $1,10 / 1M token
- Input yang disimpan: $0,55 / 1M token
- Keluaran: $4,40 / 1M token.
Model GPT-4o
Model cerdas tinggi untuk tugas kompleks | panjang konteks 128k
- Input: $2,50 / 1M token
- Input yang disimpan: $1,25 / 1M token
- Output: $10,00 / 1M token
Model mini GPT-4o
Model kecil yang terjangkau untuk tugas cepat sehari-hari | panjang konteks 128k
- Input: $0,150 / 1M token
- Input yang disimpan: $0,075 / 1M token
- Output: $0,600 / 1M token.
Model GPT-4o
Harga fine-tuning untuk GPT-4o adalah sebagai berikut:
- Input: $3.750 per 1 juta token
- Input yang disimpan: $1.875 per 1 juta token
- Output: $15.000 per 1 juta token
- Pelatihan: $25.000 per 1 juta token
Model mini GPT-4o mini
Harga fine-tuning untuk GPT-4o mini adalah sebagai berikut:
- Input: $0.30 per 1 juta token
- Input yang disimpan: $0.15 per 1 juta token
- Output: $1.20 per 1 juta token
- Pelatihan: $3.00 per 1 juta token.
Realtime API
Build low-latency, multimodal experiences including speech-to-speech.
Text:
GPT-4o:
- $5.00 / 1M input tokens
- $2.50 / 1M cached input tokens
- $20.00 / 1M output tokens
GPT-4o mini:
- $0.60 / 1M input tokens
- $0.30 / 1M cached input tokens
- $2.40 / 1M output tokens
Audio
GPT-4o:
- $40.00 / 1M input tokens
- $2.50 / 1M cached input tokens
- $80.00 / 1M output tokens
GPT-4o mini:
- $10.00 / 1M input tokens
- $0.30 / 1M cached input tokens
- $20.00 / 1M output tokens
Kesimpulan
DALL-E 2 adalah alat inovatif yang mengubah cara kita menciptakan dan memanipulasi konten visual. Kemampuannya untuk mengubah deskripsi teks menjadi gambar berkualitas tinggi dan fitur inpainting yang kuat memberikan kebebasan kreatif yang luar biasa bagi para profesional maupun penggemar.
Dengan menguasai pembuatan prompt dan memanfaatkan fitur pengeditan DALL-E 2, pengguna dapat membuka potensi penuh dari model AI yang inovatif ini. Meskipun ada tantangan seperti masalah etika dan batasan teknis, alat ini tetap menjadi pilihan yang serbaguna dan berharga untuk menghasilkan visual kustom di berbagai industri, mulai dari pemasaran hingga pendidikan.
Diskusi mengenai DALL-E 2 dan pentingnya bagi Deep Learning serta dunia secara keseluruhan sangatlah luas. DALL-E 2 merupakan pengembangan dari DALL-E, sebuah perangkat lunak penghasil gambar dari OpenAI. DALL-E 2 adalah AI yang membantu menghasilkan gambar dan seni realistis berdasarkan prompt deskriptif yang diberikan oleh pengguna dalam bahasa alami yang sederhana. Proses kerjanya terdiri dari tiga langkah: pertama, teks prompt diubah menjadi kode; kedua, gambar dihasilkan dari teks tersebut; dan akhirnya, gambar dihasilkan dari informasi semantik yang diberikan.
Kelebihan
- Menghasilkan gambar berdasarkan deskripsi teks.
- Fleksibilitas dalam pembuatan gambar.
- Kualitas gambar yang lebih baik.
- Peningkatan kreativitas dalam pembuatan gambar.
- Pengeditan dan manipulasi.
- Kepemilikan atas gambar.
- Mendukung permintaan yang rumit dan mendetail.
- Integrasi dengan alat kreatif lainnya.
Kekurangan
- Kontrol yang terbatas atas gambar yang dihasilkan.
- Bias dalam proses pembuatan gambar.
- Biaya komputasi yang tinggi.
- Implikasi etis yang mungkin muncul.
- Keterbatasan bahasa.
- Masalah hukum yang mungkin timbul.
- Biaya bulanan dapat bertambah bagi pengguna yang intensif.