DALL-E dan GPT Vision: Hasilkan dan Analisis Imej dengan AI

Kuasai asas DALL-E dan GPT Vision untuk menjana imej tersuai secara programatik dan bina aplikasi yang boleh melihat, menganalisis dan menerangkan kandungan visual.

โ˜… 4.6 (18) โฑ 1 jam 40 min ๐Ÿ“š 9 pelajaran ๐ŸŽง Versi audio

Tentang kursus ini

AI Visual sedang mengubah cara kita mencipta dan memahami kandungan digital. Sama ada anda perlu menjana grafik tersuai daripada teks atau membina aplikasi yang boleh "melihat" dan mentafsir dunia fizikal, model AI multimodal moden menjadikan keupayaan ini boleh diakses oleh semua orang. Kursus berasaskan teks ini membimbing anda melalui konsep asas DALL-E dan GPT Vision. Anda akan beralih daripada menulis gesaan teks asas kepada menjana imej kompleks secara programatik dan mengekstrak data terstruktur daripada input visual menggunakan API. Apa yang anda akan pelajari: - Fahami prinsip teras penjanaan teks-ke-imej dan visi komputer. - Reka gesaan yang tepat untuk menjana, mengedit dan menguji variasi imej berkualiti tinggi menggunakan DALL-E. - Analisis kandungan visual dengan GPT Vision untuk melakukan pengesanan objek, kapsyen imej dan menjawab soalan. - Sepadukan keupayaan AI visual ke dalam aplikasi perisian menggunakan aliran kerja API. - Guna teknik kejuruteraan gesaan moden yang dioptimumkan khusus untuk model multimodal. - Urus kos dan prestasi API dengan mengkonfigurasi mod terperinci resolusi imej. Anda akan bermula dengan meneroka konsep asas seni generatif dan seni bina model visual sebelum beralih kepada reka bentuk gesaan teks praktikal. Dari situ, anda akan membaca melalui aliran kerja penyepaduan API langkah demi langkah, belajar cara menghantar imej kepada model bahasa dan mentafsir analisis teks mereka. Kursus ini direka untuk pemula, pembangun dan pencipta yang ingin meneroka teknologi visual yang didorong oleh AI tanpa memerlukan latar belakang dalam pembelajaran mesin. Tiada pengalaman pengaturcaraan sebelum ini diperlukan, walaupun rasa ingin tahu teknikal asas adalah membantu. Langkah ke dunia AI multimodal dan mula membina aplikasi yang boleh mencipta dan memahami media visual.

Apa yang anda dapat

  • ๐Ÿ“œ Sijil tamat
    Tambah ke profil LinkedIn anda
  • ๐Ÿ’ฌ Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • ๐ŸŽง Termasuk versi audio
    Belajar sambil bergerak โ€” tanpa skrin
  • โ™พ๏ธ Akses seumur hidup
    Kembali bila-bila masa, tiada tamat tempoh
  • ๐Ÿ“ฑ Telefon atau komputer
    Berfungsi di mana-mana, mana-mana peranti
  • ๐Ÿ’ธ Pulangan 30 hari
    Tanpa soalan
  • โšก Pendek dan fokus
    1 jam 40 min kandungan praktikal

Ulasan

Belum ada ulasan โ€” jadilah yang pertama berkongsi pengalaman anda.

Tulis ulasan

โ˜†โ˜†โ˜†โ˜†โ˜†
Selepas hantar kami akan meminta anda log masuk โ€” draf disimpan.

Pelajar lain juga mengambil

Soalan lazim

Apa yang saya perlukan untuk mengikuti kursus ini? +

Hanya telefon atau komputer dengan internet. Tiada pemasangan, tiada perkakasan khas.

Bagaimana untuk membayar? +

Dengan kad melalui Stripe, atau kripto. Kami tidak menyimpan butiran kad โ€” Stripe menguruskannya dengan selamat.

Bolehkah saya dapatkan bayaran balik? +

Ya โ€” pulangan penuh dalam 30 hari, tanpa soalan.

Berapa lama saya akan mempunyai akses? +

Selamanya. Setelah membeli, kursus adalah milik anda โ€” boleh lawat semula bila-bila masa.

Adakah saya akan mendapat sijil? +

Ya. Setelah tamat, anda akan menerima sijil yang boleh ditambah ke profil LinkedIn anda.

Direka untuk pelajar dalam
Teknologi Reka bentuk Kewangan Pemasaran Kesihatan Pendidikan Hospitaliti Pembuatan