Кредити за изображения: Брайс Дърбин/TechCrunch
OpenAI представи днес подобрена версия на своя инструмент за преобразуване на текст в изображение, DALL-E, който използва ChatGPT – вирусният чатбот на OpenAI – за да облекчи част от болката при подканянето.
Повечето от днешните сложни инструменти за създаване на изображения, базирани на изкуствен интелект, приемат подкани — описания на изображения — и ги превръщат в произведения на изкуството в редица стилове, от фотореалистични до фентъзи. Но изработването на правилния вектор може да бъде предизвикателство, до такава степен, че „гъвкавото инженерство“ се е превърнало в истинска професия.
Новият инструмент на OpenAI, DALL-E 3, използва ChatGPT, за да помогне при попълването на искове. Чрез ChatGPT, абонатите на първокласните планове ChatGPT на OpenAI, ChatGPT Plus и ChatGPT Enterprise, могат да напишат заявка за изображение и да я прецизират чрез разговори с chatbot – получаване на резултатите директно в приложението за чат.
ChatGPT ще вземе кратка подкана от не повече от няколко думи и ще я направи по-описателна, предоставяйки повече насоки към модела DALL-E 3.
Интегрирането на ChatGPT не е единственото ново нещо в DALL-E 3. DALL-E 3 също така създава изображения с по-високо качество, които отразяват подканите по-точно, казва OpenAI – особено когато обработва по-дълги подкани. Той се справя по-добре със съдържание, което исторически е възпрепятствало моделите за генериране на изображения, като текст и човешки ръце.
Освен това, DALL-E 3 има нови механизми за намаляване на алгоритмичните отклонения и подобряване на безопасността, или поне така казва OpenAI. Например, DALL-E 3 ще отхвърли заявки, изискващи портрет в стила на живи художници или изображения на обществени личности. Художниците вече могат да изберат да не използват част или всичките си произведения на изкуството, за да обучат бъдещите поколения OpenAI модели да конвертират текст в изображение. (OpenAI, заедно с някои от своите конкуренти, е изправен пред съдебен процес за предполагаемо използване на защитени с авторски права творби на художници, за да обучи своите генеративни AI модели на изображения.)
Стартирането на DALL-E 3 идва в момент, когато надпреварата за генеративен AI се разгаря, особено в областта на синтеза на изображения. Конкуренти като Midjourney и Stability AI продължават да подобряват своите модели за генериране на изображения, оказвайки натиск върху OpenAI да остане на повърхността.
OpenAI планира да пусне DALL-E 3 за първокласни потребители на ChatGPT през октомври, последван от изследователски лаборатории и своите API клиенти. Компанията не каза кога – или дали – планира да пусне безплатен уеб инструмент, както направи с DALL-E 2 и оригиналния модел DALL-E.
„Internet trailblazer. Travelaholic. Страстен евангелист в социалните медии. Защитник на телевизията.“
More Stories
Новото музикално приложение на Nintendo е клонинг на YouTube Music
2027 Pixel Tablet ‘3’ може да има втори USB-C порт
Това е документът, който никой не прочете, преди да обяви смъртта на съвременната криптография