Share to: share facebook share twitter share wa share telegram print page

Sora (model teks-ke-video)

Sora
Sebuah video yang dihasilkan oleh Sora tentang seorang wanita yang berjalan di sebuah jalan di Tokyo
Tipetext-to-video model, artificial intelligence model dan diffusion model
Versi pertama15 Februari 2024
GenreModel teks-ke-video
Eponimlangit
Informasi pengembang
PembuatOpenAI
PengembangOpenAI
Informasi tambahan
Situs webopenai.com… (Inggris)
SubredditSORA
Sunting di Wikidata Sunting di Wikidata • Sunting kotak info • L • B
Info templat
Bantuan penggunaan templat ini


Sora adalah sebuah model teks-ke-video yang dikembangkan oleh organisasi penelitian kecerdasan buatan (AI) OpenAI . Model ini menghasilkan video berdasarkan perintah deskriptif serta dapat memperluas video yang sudah ada.[1][2] Sampai dengan Februari 2024, Sora masih belum tersedia luas untuk publik.[3]

Sejarah

Beberapa model teks-ke-video lainnya telah dibuat sebelum Sora, diantaranya Make-A-Video dari Meta, Gen-2 dari Runway, dan Lumiere dari Google, yang sampai pada bulan Februari 2024, juga masih dalam tahap penelitian.[4][5] OpenAI, sebelum mengumumkan Sora, telah merilis DALL·E 3, sebuah model teks-ke-gambar pada bulan September 2023.[6]

Tim yang mengembangkan Sora menamakannya setelah kata dalam bahasa Jepang untuk langit sebagai penanda untuk "potensi kreatif yang tak terbatas".[1] Pada tanggal 15 Februari 2024, OpenAI pertama kali memperlihatkan Sora dengan merilis beberapa klip video definisi tinggi yang dibuatnya, diantaranya termasuk SUV yang melaju di jalan pegunungan, animasi "monster berbulu pendek" di samping lilin, dua orang berjalan melewati Tokyo di tengah salju, dan rekaman rekaan demam emas California, dan menyatakan bahwa Sora mampu menghasilkan video berdurasi hingga satu menit.[5][4] Laporan teknis kemudian disebarkan, yang menyoroti metode yang digunakan untuk melatih model tersebut.[2][7] CEO OpenAI Sam Altman juga memposting serangkaian tweet, menanggapi permintaan pengguna Twitter dengan video yang dihasilkan oleh Sora.

OpenAI telah menyatakan bahwa mereka berencana untuk membuat Sora tersedia untuk umum tetapi tidak disebutkan kapan akan tersedia.[5][3] Perusahaan memberikan akses terbatas kepada sebuah "tim merah" kecil, termasuk para ahli di bidang misinformasi dan bias, untuk melakukan pengujian terhadap model tersebut.[6] Perusahaan juga berbagi Sora dengan sekelompok kecil profesional kreatif, termasuk pembuat video dan seniman, untuk mencari masukan mengenai kegunaannya di bidang kreatif.[8]

Kemampuan dan keterbatasan

Teknologi di balik Sora merupakan pengembangan dari teknologi di balik DALL-E 3. Menurut OpenAI, Sora adalah transformator difusi[9] – model difusi laten denoising dengan satu transformer sebagai denoiser. Sebuah video dihasilkan dalam ruang laten dengan "tambalan" 3D, kemudian diubah menjadi ruang standar oleh dekompresor video. Pembuatan teks ulang digunakan untuk menambah data pelatihan, dengan menggunakan model video-ke-teks untuk membuat deskripsi mendetail pada video.[7]

OpenAI melatih model tersebut menggunakan video yang tersedia secara publik serta kumpulan video berhak cipta yang dilisensikan untuk tujuan tersebut, namun tidak mengungkapkan jumlah dan sumber pasti dari video tersebut.[1] Setelah dirilis, OpenAI mengakui beberapa kekurangan Sora, termasuk kesulitannya dalam mensimulasikan fisika kompleks, memahami kausalitas, dan membedakan antara kiri dari kanan.[10] Salah satu contoh menunjukkan sekelompok anak serigala yang tampak secara ganda, sehingga menciptakan skenario yang sulit diikuti.[11] OpenAI juga menyatakan bahwa, sesuai dengan praktik keselamatan perusahaan yang ada, Sora akan membatasi teks yang berisi gambar seksual, kekerasan, kebencian, atau konten selebriti, serta konten yang menampilkan kekayaan intelektual yang sudah ada.[6]

Tim Brooks, seorang peneliti Sora, menyatakan bahwa model tersebut menemukan cara membuat grafika komputer 3D hanya dari kumpulan datanya, sementara Bill Peebles, juga seorang peneliti Sora, mengatakan bahwa model tersebut secara otomatis membuat sudut video yang berbeda tanpa diminta sebelumnya.[5] Menurut OpenAI, video yang dihasilkan oleh Sora ditandai dengan metadata C2PA untuk menunjukkan bahwa video tersebut dihasilkan oleh kecerdasan buatan.[1]

Reaksi

Will Douglas Heaven dari MIT Technology Review menyebut video demonstrasi tersebut "mengesankan", namun menyatakan bahwa video tersebut pasti dipilih secara khusus dan mungkin tidak mewakili keluaran khas Sora pada umumnya.[8] Akademisi Amerika Oren Etzioni menyatakan kekhawatirannya atas kemampuan teknologi tersebut dalam menciptakan disinformasi daring untuk kampanye politik.[1] Untuk Wired, Steven Levy juga menulis bahwa film tersebut berpotensi menjadi "badai informasi yang salah" dan berpendapat bahwa klip pratinjaunya "mengesankan" tetapi "tidak sempurna" dan "menunjukkan pemahaman yang muncul tentang tata bahasa sinematik" karena perubahan tangkapan kamera tanpa diminta. Levy menambahkan, "akan memakan waktu yang sangat lama, jika akan terjadi, sebelum teks-ke-video mengancam pembuatan film yang sebenarnya."[5] Lisa Lacy dari CNET menyebut bahwa contoh videonya "sangat realistis – kecuali mungkin saat wajah manusia terlihat dari dekat atau saat makhluk laut sedang berenang".[6]

Lihat pula

Referensi

  1. ^ a b c d e Metz, Cade (February 15, 2024). "OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos". The New York Times. Diarsipkan dari versi asli tanggal February 15, 2024. Diakses tanggal February 15, 2024.  Kesalahan pengutipan: Tanda <ref> tidak sah; nama "NYT_CM_2024_02_15" didefinisikan berulang dengan isi berbeda
  2. ^ a b Brooks, Tim; Peebles, Bill; Holmes, Connor; DePue, Will; Guo, Yufei; Jing, Li; Schnurr, David; Taylor, Joe; Luhman, Troy (February 15, 2024). "Video generation models as world simulators". OpenAI. Diarsipkan dari versi asli tanggal February 16, 2024. Diakses tanggal February 16, 2024.  Kesalahan pengutipan: Tanda <ref> tidak sah; nama "OAI_research" didefinisikan berulang dengan isi berbeda
  3. ^ a b Yang, Angela (February 15, 2024). "OpenAI teases 'Sora,' its new text-to-video AI model". NBC News. Diarsipkan dari versi asli tanggal February 15, 2024. Diakses tanggal February 16, 2024.  Kesalahan pengutipan: Tanda <ref> tidak sah; nama "NBC" didefinisikan berulang dengan isi berbeda
  4. ^ a b Shankar Das (February 15, 2024). "Sora AI Can Generate Realistic Video based on Text Prompts: OpenAI". Epi Express. Diarsipkan dari versi asli tanggal February 15, 2024. Diakses tanggal February 16, 2024.  Kesalahan pengutipan: Tanda <ref> tidak sah; nama "Mash" didefinisikan berulang dengan isi berbeda
  5. ^ a b c d e Wired. Diarsipkan dari versi asli Parameter |archive-url= membutuhkan |url= (bantuan) tanggal February 15, 2024.  Tidak memiliki atau tanpa |title= (bantuan); Kesalahan pengutipan: Tanda <ref> tidak sah; nama "Wired" didefinisikan berulang dengan isi berbeda
  6. ^ a b c d Lacy, Lisa (February 15, 2024). "Meet Sora, OpenAI's Text-to-Video Generator". CNET. Diarsipkan dari versi asli tanggal February 16, 2024. Diakses tanggal February 16, 2024.  Kesalahan pengutipan: Tanda <ref> tidak sah; nama "CNET" didefinisikan berulang dengan isi berbeda
  7. ^ a b Edwards, Benj (February 16, 2024). "OpenAI collapses media reality with Sora, a photorealistic AI video generator". Ars Technica (dalam bahasa Inggris). Diarsipkan dari versi asli tanggal February 17, 2024. Diakses tanggal February 17, 2024.  Kesalahan pengutipan: Tanda <ref> tidak sah; nama "ars" didefinisikan berulang dengan isi berbeda
  8. ^ a b Heaven, Will Douglas (February 15, 2024). "OpenAI teases an amazing new generative video model called Sora". MIT Technology Review. Diarsipkan dari versi asli tanggal February 15, 2024. Diakses tanggal February 15, 2024.  Kesalahan pengutipan: Tanda <ref> tidak sah; nama "WDH_MIT_2024_02_15" didefinisikan berulang dengan isi berbeda
  9. ^ Peebles, William; Xie, Saining (2023). "Scalable Diffusion Models with Transformers". 2023 IEEE/CVF International Conference on Computer Vision (ICCV). hlm. 4172–4182. arXiv:2212.09748alt=Dapat diakses gratis. doi:10.1109/ICCV51070.2023.00387. ISBN 979-8-3503-0718-4. ISSN 2380-7504. 
  10. ^ Pequeño IV, Antonio (February 15, 2024). "OpenAI Reveals 'Sora': AI Video Model Capable Of Realistic Text-To-Video Prompts". Forbes. Diarsipkan dari versi asli tanggal February 15, 2024. Diakses tanggal February 15, 2024. 
  11. ^ "Sora Review | New AI Video Generator From OpenAI" (dalam bahasa Inggris). 2024-02-18. Diakses tanggal 2024-02-20. 

Pranala luar

[[Kategori:Teknologi film dan video]] [[Kategori:Penerapan kecerdasan buatan]]

Baca informasi lainnya:

Berikut adalah daftar masjid yang ada di provinsi Kalimantan Tengah, Indonesia. Masjid Raya Darussalam, Palangka Raya.[1][2] Masjid Agung Kiai Gede, Kotawaringin Barat.[3] Masjid Agung Riyadhlush Shalihin, Kotawaringin Barat Masjid Agung Baiturrahman, Barito Selatan.[4] Masjid Agung Al-Istiqlal, Murung Raya.[5][6] Masjid Agung Wahyu Al-Hadi, Kotawaringin Timur.[7][8][9] Masjid Agung Ar Raudhah, Pulang Pisau[10] Masji…

Autobianchi Logo Autobianchi terakhir Tipe Industri otomotif Nasib Digabung dengan Lancia PenerusLancia Didirikan 11 Januari 1955 Ditutup 1995 Lokasi Turin, Italia IndustriOtomotif IndukFiat Group Autobianchi (pengucapan bahasa Italia: [autoˈbjaŋki]) adalah sebuah perusahaan otomotif Italia yang didirikan oleh Bianchi, Pirelli, dan Fiat tahun 1955. Perusahaan ini hanya memproduksi sangat sedikit model selama berdiri, dan kebanyakan memproduksi mobil kecil. Produknya yang cukup terkenal ad…

Capital and largest city of Indonesia For other uses, see Jakarta (disambiguation). Special Capital Region in Java, IndonesiaJakartaSpecial Capital RegionSpecial Capital Region of JakartaDaerah Khusus Ibukota JakartaSkyline of the Golden Triangle of JakartaCar free day in Bundaran HIMerdeka PalaceNational Museum of IndonesiaAsean headquartersJakarta History Museum in Jakarta Old TownMonas Coat of armsWordmarkNicknames: The Big DurianNew York Van JavaJ-Town[1]Motto(s): Jaya Raya…

ILWUInternational Longshore and Warehouse UnionDidirikan11 Agustus 1937 (1937-08-11)Anggota37,022 (2013)[1]NegaraAmerika Serikat, KanadaAfiliasiKBKTokoh pentingRobert McEllrath, International PresidentLokasi kantorSan Francisco, ASSitus resmiwww.ilwu.org International Longshore and Warehouse Union (ILWU) adalah sebuah serikat buruh yang utamanya mewakili para pekerja dok di Pesisir Barat Amerika Serikat, Hawaii, dan di British Columbia, Kanada. Serikat tersebut juga mewakili para pe…

Indian TV series or programme ThangamagalGenre Drama Written byM.S FanirajScreenplay bySelva VadivelDirected byHarish AdhithiyaStarring Yuvan Mayilsamy Ashwini Aanandita ComposerVallavanCountry of originIndiaOriginal languageTamilNo. of episodes25 (as of February 2024)ProductionProducersVani Moorthi Palaparthy Abishek PalaparthyCinematographyMa.Po. AnandhEditorK. SukumarCamera setupMulti-cameraRunning timeapprox. 22-25 minutes per episodeProduction companyBeyond CinemasOriginal releaseNetworkSta…

John TateLahirJohn Torrence Tate Jr.(1925-03-13)13 Maret 1925Minneapolis, Minnesota, Amerika SerikatMeninggal16 Oktober 2019(2019-10-16) (umur 94)[1]AlmamaterUniversitas Harvard (A.B., 1946)Universitas Princeton (Ph.D., 1950)Dikenal atasKonjektur TateModul TatePenghargaanPenghargaan Abel (2010)Penghargaan Wolf (2002/03)Penghargaan Steele (1995)Penghargaan Cole dalam Teori Bilangan (1956)Karier ilmiahBidangMatematikaInstitusiUniversitas Princeton (1950–1953)Universitas Columbia (19…

Fusuma sebagai partisi di rumah tradisional Jepang Fusuma (襖code: ja is deprecated ) adalah panel berbentuk persegi panjang yang dipasang vertikal pada rel dari kayu, dapat dibuka atau ditutup dengan cara didorong. Kegunaannya sebagai pintu dorong atau pembatas ruangan pada washitsu. Seperti halnya shōji, fusuma dipasang di antara rel kayu; rel bagian atas disebut kamoi (鴨居code: ja is deprecated ) dan rel bagian bawah disebut shikii (敷居code: ja is deprecated ). Rangka dibuat dari kayu…

The Right HonourableThe Lord HackingMember of the House of LordsLord Temporalas a hereditary peer7 November 1971 – 11 November 1999Preceded byThe 2nd Baron HackingSucceeded bySeat abolishedIncumbentas an elected hereditary peer 19 November 2021By-election19 November 2021Preceded byThe 3rd Viscount Simon Personal detailsBorn (1938-04-17) 17 April 1938 (age 85)Political partyLabour (1998-2003, since 2021) Crossbench (2009-2014) Conservative(until 1998)Alma materClare College, C…

Mihály Varga Menteri Keuangan HungariaPetahanaMulai menjabat 7 Maret 2013Perdana MenteriViktor Orbán PendahuluGyörgy MatolcsyPenggantiPetahanaMasa jabatan1 Januari 2001 – 27 Mei 2002Perdana MenteriViktor Orbán PendahuluZsigmond JáraiPenggantiCsaba LászlóAnggota Majelis Nasional HungariaPetahanaMulai menjabat 26 September 1994Masa jabatan2 Mei 1990 – 27 Juni 1994 Informasi pribadiLahir26 Januari 1965 (umur 59)Karcag, HungariaPartai politikFideszSuami/istr…

American newspaper publisher and politician (1838–1893) John MenardPersonal detailsBornJohn Willis Menard(1838-04-03)April 3, 1838Kaskaskia, Illinois, U.S.DiedOctober 9, 1893(1893-10-09) (aged 55)Washington, D.C., U.S.Political partyRepublicanSpouse(s)Lucy Samuels (1859–1871 (sep)) Elizabeth MaryChildren2 daughters, 1 sonEducationIberia College John Willis Menard (April 3, 1838 – October 8, 1893) was a federal government employee, poet, newspaper publisher and politician born in Kaska…

2010 film by Joe Johnston The WolfmanTheatrical release posterDirected byJoe JohnstonScreenplay by Andrew Kevin Walker David Self Based onThe Wolf Manby Curt SiodmakProduced by Scott Stuber Benicio del Toro Rick Yorn Sean Daniel Starring Benicio del Toro Anthony Hopkins Emily Blunt Hugo Weaving CinematographyShelly JohnsonEdited by Dennis Virkler Walter Murch Music byDanny ElfmanProductioncompanies Universal Pictures Relativity Media Stuber Pictures Distributed byUniversal PicturesRelease dates …

American rock musician (born 1947) Don HenleyHenley performing with the Eagles in 2019Background informationBirth nameDonald Hugh HenleyBorn (1947-07-22) July 22, 1947 (age 76)Gilmer, Texas, U.S.[1]OriginLinden, Texas, U.S.GenresRockcountry rockhard rockpop rockOccupation(s)Musiciansingersongwriterrecord producerInstrument(s)VocalsdrumsguitarYears active1970–presentLabelsAsylumGeffenWarner Bros.CapitolMember ofEaglesWebsitedonhenley.comMusical artist Donald Hugh Henley (born July …

Piramida populasi Indonesia tahun 2020, dihasilkan dari basis data Biro Sensus AS Demografi Indonesia mencakup statistik populasi Indonesia, seperti jumlah, distribusi, dan kepadatan penduduk, serta data demografis lainnya. Populasi Indonesia berdasarkan sensus penduduk tahun 2020 yaitu sebesar 270,2 juta jiwa,[1] meningkat dibandingkan sensus penduduk 2010 yang menghasilkan angka 237,64 juta jiwa.[2] Populasi Indonesia diperkirakan akan terus bertambah dan diproyeksikan mencapai…

pemain akrobat Tiongkok di tengah udara setelah didorong dari sebuah papan loncat, Tiongkok, 1987 Akrobatik (dari Bahasa Yunani ἀκροβατέω akrobateō, berjalan berjinjit, menopang[1]) adalah penampilan luar biasa yang melibatkan keseimbangan, ketangkasan, dan koordinasi motorik. Hal ini dapat ditemukan pada banyak seni pertunjukan, acara olahraga, dan seni bela diri. Akrobat paling sering dikaitkan dengan aktivitas yang secara ekstensif menggunakan elemen senam, seperti acro dan…

Badan Regulasi Telekomunikasi Indonesia BRTIGambaran umumSingkatanBRTIDidirikan8 September 2000Dasar hukum pendirianUndang-Undang Nomor 36 Tahun 1999Dibubarkan26 November 2020Dasar hukum pembubaranPeraturan Presiden Nomor 112 Tahun 2020Kantor pusatMenara Ravindo, Kav.75 Lantai 11, Jl. Kebon Sirih, Daerah Khusus Ibukota Jakarta 10340Situs webhttp://www.brti.or.idSunting kotak info • L • BBantuan penggunaan templat ini Badan Regulasi Telekomunikasi Indonesia disingkat BRTI adala…

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Dai Longbang – news · newspapers · books · scholar · JSTOR (December 2009) (Learn how and when to remove this template message) 戴龍邦Dai LongbangBorn1732 (1732)Shanxi, ChinaDied1801 (aged 68–69)ChinaStyleNeijiaXinyiquanTaijiquanTeacher(s)Cao Ji…

This list is incomplete; you can help by adding missing items. (June 2014) List of events ← 1995 1994 1993 1992 1991 1996 in China → 1997 1998 1999 2000 2001 Decades: 1970s 1980s 1990s 2000s 2010s See also:Other events of 1996History of China  • Timeline  • Years The following lists events from 1996 in China. Incumbents Party General Secretary: Jiang Zemin President: Jiang Zemin Premier: Li Peng Vice President: Rong Yiren Vice Premier: Zhu Rongji Gover…

Football match2015 All-Ireland Senior Football Championship FinalEvent2015 All-Ireland Senior Football Championship Dublin Kerry 0–12 0–9 Date20 September 2015VenueCroke Park, DublinMan of the MatchBrian FentonRefereeDavid ColdrickWeatherHeavy Rain 14 °C (57 °F)← 2014 2016 → The 2015 All-Ireland Senior Football Championship Final, the 128th event of its kind and the culmination of the 2015 All-Ireland Senior Football Championship, was played at Croke Park in Dublin on…

County in California, United States County in California, United StatesKern CountyCounty Images, from top down, left to right: Downtown Bakersfield, Cesar E. Chavez National Monument, Fort Tejon barracks, an F-35 landing at Edwards Air Force Base, the Midway-Sunset Oil Field SealInteractive map of Kern CountyLocation in the state of CaliforniaCoordinates: 35°20′N 118°43′W / 35.34°N 118.72°W / 35.34; -118.72CountryUnited StatesStateCaliforniaIncorporatedApril …

Urban adult contemporary radio station in New Orleans This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: WYLD-FM – news · newspapers · books · scholar · JSTOR (September 2008) (Learn how and when to remove this template message) WYLD-FMNew Orleans, LouisianaBroadcast areaNew Orleans metropolitan areaFrequency98.5 …

Kembali kehalaman sebelumnya