В прошлом посте я рассказывал о том, что планирую добавить сгенерированные картинки в поиск.
Сказано — сделано. Добавил 8.5M изображений, под лицензией CC0, то есть «Free of copyright».
Более того, убрал те, что не позволяют коммерческое использование, то есть все 18 миллионов, что были, а именно ImageNet21k, Open Images и Places365.
При этом движении, целевая аудитория сместилась с тех, кто тренирует модели машинного обучения на тех, кто использует картинки как reference при создании 3D моделей для фильмов или игр.
Пообщался с творцами прекрасного и один из запросов от ребят — можно ли скомбинировать в одном запросе поиск и по картинке и по тексту?
Да, можно, и технически это не сложно.
Для тех, кто не знает, что происходит под капотом в сервисах, вроде моего ternaus.com напомню.
Когда мы делаем оценку похожести двух изображений мы не сравниваем их попиксельно.
Вместо этого к каждой применяем функцию, которая отображает в пространоство эмбедингов и сравнивем уже их.
В переводе на русский язык: «Прогоняем специльную сеть по картинке, и сравнивем выходы из сетей.»
С текстом та же история. Сравниваются не буквы в фразах “Вера любит Пашу” и “Географичка ревнует физрука”, а эмбединги, то есть вектора, полученные из них.
А можно ли сравнивать картинку (пиксели) и текст(буквы)? До начала 2021 года ответ был нет.
В начале 2021 года Open AI выпустили модель CLIP, которая отображает буквы и пиксели в одно пространство, что позволяет сравнивать их между собой.
Так получилось, что под капотом у меня именно эта модель. Изначально я думал только про сравнение изображений, и выбрал модель, которая готовит самые высококачественные эмбединги, что было понятно по соревнованию Kaggle: Google Universal Image Embedding.
Про то, что модель работает и для текста я тогда не думал — это была доп фишечка и поиск текстом на сайт Ternaus. com добавил во многом потому что мог и для упрощения отладки.
А что если на вход подать и картинку, и текст, извлечь из них эмбединги, усреднить и использовать этот гибридный вектор для поиска?
Наивная часть интуиции надеялась, что покажет красную сову, а умудренная опытом шептала, что garbage in — garbage out, и выведет какой-то хлам.
Хлам, потому что хочется сказать, что в пространстве эмбедингов есть компактный кластер сов и компактный кластер красного, а между ними случайность, пустота и грехопадение.
Победила юношеская наивность, совы и правда покраснели. Будь я в академии, поизучал бы вопрос. Свойства топологии пространства эмбедингов — это и интересно, и практично.
Более того, можно усреднять эмбединги с разными весами, варьируя влияние совы и красноты на результат.
Кому интересно попробовать скрестить ежа с ужом, то есть картинки и текстового описания — добро пожаловать на сайт, играйте, скачивайте, используйте. Если вставляете в блог пост — буду благодарен если оставите, в качестве благодарности, ссылку на Ternaus. com. Если нет, то тоже не конец мира.
В целом, качество результатов больше зависит не от сложности входных данных, а есть ли в базе данных то, что требуется. Во многом выстелило то, что было нагенерировано много странного, что не встречается в обычных фотографиях. И красная сова тому пример.
Если подумать, то идея усреднения эмбедингов еще глубже.
И тут есть две мысли:
Первая:
Последнее время эмбединги извлекают из песен, фильмов, временных рядов, пользователей, и товаров в магазине.
Прямо напрашивается фича в Spotify — найди мне что-то похожее на вот эту композицию (тыкаем в фугу Баха из плейлиста), но в стиле регги, и голосом похожим на Джона Ленона (это уточняем текстом). Ивлекаем эмбединг из песни, из текста, усредняем, используем в поиске и ага. Прям идея для стартапа.
Вторая:
Генерация картинок по тексту + картинке наброску полетела потому что хочется получить что-то похожее на X, только чуть подправленное.
Проблемы у текущих генерирующих алгоритмов:
Генерировать медленно. Хочется секнды, получаем минуты.
Заранее непонятно, что сгенерирует и насколько похоже на то, что у тебя в голове.
А вот усреднение эмбедингов — это хорошая аппроксимация, которая выезжает за счет того, что опредять что изображено на картинке мы умеем гораздо лучше чем эти картинки генерировать.
Может получится, что в ряде случаев, вместо генерации можно подсунуть поиск по существующим, скажем использовать API у меня на сайте.
А я пока:
Засек время, чтобы посмотреть когда lexica.art и krea.ai добавят такую функциональность. У Lexica под капотом тоже CLIP, им должно быть быстро. Krea.AI, как я понимаю, CLIP пока не использует, им будет посложнее.
И буду думать, что делать дальше.
Следующее, что хочется добавить по технической части — это Chrome Extension. Выделил текст или картинку где-то в интернете, навел мышку, выбрал в меню: “Search on Ternaus”, вжух и тебе показало результат на сайте. Делается в рамках добавления каналов по привлечению траффика на сайт.
А по продуктовой — еще поговорить с художниками для фильмов и для Game Dev, которым нужны наркоманские картинки, как ref’ы. Если есть такие в аудитории, пишите — буду рад пообщаться и добавить функционал, который вам интересен.
P.S. Блог пост начался с картинки королевы Елизаветы + “3D unreal engine”. На удивление тоже работает.
1
В ожидании зарплаты
2
Получил зарплату
3
Шутки про заработную плату
4
Приколы про зарплату
5
Зарплата юмор
6
Анекдот про зарплату
7
Зарплата картинки прикольные
8
Приколы про зарплату
9
Банкомат юмор
10
Открытки ура зарплата
11
Зарплата юмор
12
Жду зарплату
13
Ждите зарплату
14
Маленькая зарплата прикол
15
Цитаты про зарплату
16
Демотиваторы про зарплату
17
Почему вы опоздали на работу
18
Демотиваторы про зарплату
19
День зарплаты Мем
20
Приколы мемы про зарплату
21
Где зарплата приколы картинки
22
Смешная зарплата
23
Когда задерживают зарплату
24
Когда дали зарплату
25
Приколы про зарплату
26
Зарплата в России Мем
27
Чихуахуа Мем
Приколы с тележкой
29
Банкомат в стене
30
Демотиваторы про зарплату
31
Зарплаты нет демотиватор
32
Маленькая зарплата карикатура
33
Достойная зарплата
34
Демотиваторы про зарплату
35
Коты у банкомата
36
Заработная плата карикатура
37
Возле банкомата прикол
38
Маленькая зарплата демотиваторы
39
Смешные картинки про зарплату
40
Обезьяна и компьютер
41
Зарплата карикатура
42
Хочешь зарплату в два раза больше Путин
43
Рис юмор
44
Маленькая зарплата карикатура
45
Возле банкомата прикол
46
Кот в сапогах Мем
47
Поздравление с первой зарплатой прикольное
48
Мемы про зарплату
49
Подняли зарплату Мем
50
Кот с деньгами Мем
51
Средняя зарплата демотиватор
52
Но люди не специалисты
53
Деньги карикатура
54
Исторические несмешные мемы
55
Путин и его богатство
56
Ламзан Каделов. Приколь
57
Мопс в шапке
58
Шла вторая неделя после зарплаты
59
Мемы про задержку зарплаты
60
Том Хэнкс против танка Мем
investment
person
finance
entrepreneur
business
dollar
saving
Денежные изображения и картинкиинвесткурс
инвестиционно-финансовый
sand cityunited statesfinancing
taxTexture backgroundsgovernment
businessnewspapercorporate
equityfinanceblog
coinfinancial aidchecking account
entrepreneurwallstreetinvestor
ikeja graikejanigeria
onold torontodowntown
dimenickelpension
–––– –––– –––– – –– –– – –––– –– – –– –––– – – –– ––– –– –––– – –.
handpiledreserve
Люди изображения и картиныработаЖенщины изображения и изображения
erlangendeutschlandnote
Hd grey wallpapersstipendmaking money online
meetingofficeworking
suitmanprofessional
canadaroyal canadian mintsussex drive
toronto80 spadina ave.on m5v 2j4
us treasury departmentpennsylvania avenue northwestwashington
Money Images & PicturesInvestcourse
People Images & PictureWomen Images & Pictures
BusinessNewspercorport
HD Serue WallpaperStiperSmaking
HD Seru mintsussex drive
onold torontodowntown
handpiledreserve
erlangendeutschlandnote
встреча офисная работа
предприниматель уоллстритинвестор
toronto80 spadina ave. on m5v 2j4
dimenickelpension
–––– –––– –––– ––––– –––– –– – –– ––– – – – –– ––– –– –––– – –. Связанные коллекции0010
suitmanprofessional
ikeja graikejanigeria
us treasury departmentpennsylvania avenue northwestwashington
Jp Valery
Money images & imagesinvestcourse
Towfiqu barbhuiya
handpiledreserve
–––– –––– –––– ––––– –––– –– – –– –––– – – –– ––– –– –––– – –.
Alexander Mils
investmentfinancial
Brooke Cagle
People images & picturesworkWomen images & pictures
Vitaly Taranov
sand cityunited statesfinancing
Markus Spiske
erlangendeutschlandnote
Alexander Grey
taxTexture backgroundsgovernment
Adeolu Eletu
BusinessNewspapercorporate
Руководство по ведению блога
Hd серые обоистипендиязарабатывание денег в Интернете
Kenny Eliason
equityfinanceblog
Amy Hirschi
meetingofficeworking
Kenny Eliason
coinfinancial aidchecking account
Icons8 Team
suitmanprofessional
Bram Naus
entrepreneurwallstreetinvestor
PiggyBank
canadaroyal canadian mintsussex drive
Benjamin Dada
ikeja graikejanigeria
PiggyBank
toronto80 spadina ave. on m5v 2j4
PiggyBank
onold torontodowntown
PiggyBank
казначейство США Пенсильвания авеню северо-запад Вашингтон
PiggyBank
dimenickelpension Просмотреть изображения премиум-класса
900 on6011 900 | 20% off at iStock Unsplash logoMake something awesome
323.121Bilder
Mann handfüllen US-Steuerformular. Steuerformular für uns Geschäft
Junger Mann halt Geldbörse mit Eurogeld in den Händen
finanzieller und geschäftlicherhintergrund für gelmünzen stapeln. запасные части и содержание, финансовая банковская концепция geschäftskonzept ideen, инвестиции, фонды, отчеты, дивиденды и прибыль. — заработная плата фото и фотоFinanzieller und geschäftlicher Hintergrund für das Stapeln von…
vergleichen sie lohnlücke, geldbezahlung — заработная плата фото и фотоVergleichen Sie Lohnlücke, Geldbezahlung
konzept sinender löhne в Германии. sinkende loehne in deutschland — фото и фотографии заработной платыKonzept sinkender löhne в германии. Sinkende Loehne в…
Konzept sinender Energielöhne в Германии. Sinkende Loehne в Германии.
vergleichen sie lohnlücke, geldlohn — фото и фотографии заработной платы0011 nahaufnahme der hand person mit euro-währung — pay stock-fotos und bilder Nahaufnahme der Hand Person mit Euro-WährungNahaufnahme der Person, die aufgefächerte Euro-Währungsnoten auf die rosa Hintergrund zeigt
-bezaung avor mann, der sich заработная плата фото и фотографииMann, der sich auf die Zahlung vorbereitet
nahaufnahme einer nicht wiederzuerkennenden geschäftsfrau, die in einem büro finanzen berechnet — зарплата stock-fotos und die bilder Nahaufnahme einer Geschäftsfrau,. ..0011 die menschen umzingelten münzstapel. сбор средств и wohltätigkeit. unternehmen, совместное предприятие. Faire verteilung des einkommens unter den teammitgliedern. entwicklung der verwendung von haushaltsmitteln. анлаггрупп. коррупция — зарплата фото и фотографии
Die Menschen umzingelten Münzstapel. Сбор средств и Wohltätigkeit
Münzen stapeln sich mit Waage. Geldmanagement, Finanzplan,…
halten von gehaltsscheck oder gehaltsscheck oder versicherungsscheck — salary stock-fotos und bilderHalten von Gehaltsscheck oder Gehaltsscheck oder…
Gehaltsscheck oder Gehaltsscheck oder Versicherungsscheck in der Hand halten
mann vergleicht zwei münzstapel — salary Фото и фотографииMann vergleicht zwei Münzstapel
buchhaltung, finanzen, bankdaten.Buchhaltung, Finanzen, Bankdaten. Winzige Buchhalter-Charaktere…
запасные части, используемые для изготовления и обработки. падали nahaufnahme sparschwein und silbermünzen. 3d-рендеринг-иллюстрация — зарплата стоковые фотографии и изображенияSparen Sie Geld und Anlagekonzept. Nahaufnahme Sparschwein und…
text der gehalt an kleine tafel mit münze stack — зарплата stock-fotos und bilderText der Gehalt an kleine Tafel mit Münze Stack
0011 geldbezogene konzepte, квадратная линия вектор-символ gesetzt. — график заработной платы, -клипарт, -мультфильмы и -символ
Geldbezogene Konzepte, квадратная линия вектор-символ gesetzt.
nahaufnahme einer nicht erkennbaren geschäftsfrau mit taschenrechner und Laptop in einem büro — зарплата stock-fotos und bilder nahaufnahme einer nicht erkennbaren Geschäftsfrau mit. ..
Линия-Мюнцен-Символ
Календарь на конец сентября 2021 года и отчет о заработной платеhalten eine Brieftasche mit Papiergeld und…
finanzhintergrund der euro-banknotenwährung — фото и фото зарплатыFinanzhintergrund der Euro-Banknotenwährung
unternehmer geben scheck an kollegen — зарплата stock-fotos und bilderUnternehmer geben Scheck an Kollegen
Nahaufnahme der Hand eines Geschäftsmannes, die einem Kollegen am Arbeitsplatz einen Scheck ausstellt
man benutzt einen taschenrechner und full das online-steuererklärungsformular für die zahlung aus. finanzforschung, staatliche steuern und berechnung steuererklärungskonzept. steuer- und mehrwertsteuerkonzept. — Заработная плата фото и фотографииMan benutzt einen Taschenrechner und Füllt das Online-Steuererklär
hand trennt fünf geldsäcke, бизнес-концепт-иллюстрация — зарплата фондовая графика, -клипарт, -мультфильмы и -символHand trennt fünf Geldsäcke, Business-Konzept-Illustration
излученияhandelskonzept.Emissionshandelskonzept. Bilanz der CO2-Emissionen mit der…
gehaltsabrechnung, календарь mit datum gehaltszahlung, mann zahlt geld. arbeit buchhalter, überprüfen sie die berechnung der zahlung, ausgaben. буххальтунг. вектор-иллюстрация — графика зарплаты, -клипарт, -мультфильмы и -символGehaltsabrechnung, Kalender mit Datum Gehaltszahlung, Mann zahlt…
gehaltsverhandlung, gehaltserhöhungsgespräch oder lohn- und leistungsvereinbarung, geschäftsabschluss oder fusions- und übernahmekonzept — salary stock-grafiken, -clipart, -cartoons und -symbole Gehaltsverhandlungen, Lohnerhöhungsgespräche oder Lohn- und Leistungsvereinbarungen, Geschäftsabschluss oder Fusions- und Übernahmekonzept, Geschäftsleute schütteln nach Abschluss der Vereinbarung Handschlag auf einen Stapel Geldnoten Stapel.
Mann bei der Berechnung von Budget und Finanzen
einkommensunterschiede zwischen arm und reich und die frage «справедливо?» — оклад фото и фотоEinkommensunterschiede zwischen Arm und Reich und die Frage «Fair?
урожай крупным планом ärztin ärztin hält rosa sparschwein — оклад сток фото и фотоCrop Close up Ärztin Ärztin hrält rosa Sparschwein символ
. Symbole für nfc-zahlungssätze. wireless-zahlungssymbol-sammlung, kreditkarte tippen auf bezahlen. vektorflache isolierte linie — stock-grafiken, -clipart, -cartoons und -symboleСимвол для технологии NFC. Символ для NFC-Zahlungssätze….
зеленый дорожный знак — зарплата фото и фотозеленый дорожный знак
buchhaltung und buchhaltung. winzige buchhalter-charaktere bei riesigen clip board Füllung buchhaltungsdaten, graphen und диаграмма — графика зарплаты, -клипарт, -мультфильмы и -символ Buchhaltung und Buchhaltung. Winzige Buchhalter-Charaktere bei…
Buchhaltung und Buchhaltung. Winzige Buchhaltercharaktere a einem riesigen Klemmbrett, das Buchhaltungsdaten, Grafiken und Diagramme füllt, die Geld zurückerstatten. Finanzberatung. Мультфильм Menschen векторные иллюстрации
enttäuschung. семья юнг. der mann und die schwangere frau erhielten einen краткое и документальное. hiobsbotschaft.com zu hause auf der диван sitzen — зарплата фото и фотографииEnttäuschung. Семья Юнге. Der Mann und die schwangere Frau…
gleichgeschlechtliche ausgewogenheit und parität — оклад фото и фотоGleichgeschlechtliche Ausgewogenheit und Parität
finanzgeschäft euro-aktienhintergrund — оклад stock-fotos und bilderFinanzäft0011
Finanzen Unternehmensrechnung Bestandshintergrund mit Stapel von Euro-Münzen auf Datenblatt
money icons-big series — зарплата stock-grafiken, -clipart, -cartoons und -symboleMoney Icons-Big Series
Geld, Finanzen,
zahltag-concept- календарь с маркером и eingekreisten tag des gehalts — зарплата фото и фотографии Zahltag-Concept-Kalender mit Marker und eingekreisten Tag des. ..
BNPL Купи сейчас, заплати потом Online-Shopping-Konzept.
versicherungsagent anwalt finanzberater makler diskutiert beratung reifes paar mittleren alters vertragsdokumente unterzeichnen, immobilien kaufen, investitionen zu hause — salary stock-fotos und bilderVersicherungsagent Anwalt Finanzberater Makler diskutiert…
nahaufnahme einer mittelerwachsenen frau, die ihre energierechnungen zu hause überprüft und in Ихрем Вонциммер сидит. sie hat einen besorgten gesichtsausdruck — стоковые фото и фотографии зарплатыNahaufnahme einer mittelerwachsenen Frau, die ihre…
geschäftsmann übergibt scheck — зарплата фото и фотографииGeschäftsmann übergibt чек
glückliches бизнес-команда юнгер мультиэтнический бюромитарбайтер feiert sieg und großen. — заработная плата фото и фотографииGlückliches Business-Team junger multiethnischer Büromitarbeiter…
инфляция — заработная плата графика, -клипарт, -мультфильмы и -символИнфляция
деловой человек и женщина характер wässern geld baum, wachsende svermögen kapital f rückerstattung pflege von pflanze mit goldmünzen — график зарплаты, -клипарт, -мультфильмы и -символ Business Mann und Frau Charaktere wässern Geld Baum, wachsende. ..
Geschäftsmann und Geschäftsfrau Charaktere gießen Geldbaum, wachsen Vermögenskapital für die Rückerstattung Pflege von Pflanzen mit Goldmünzen auf Zweig. Рой, Концепция окупаемости инвестиций. Cartoon Menschen Vektor Illustration
der Junge mann wartete darauf, vom chef gehalt oder lohn zu erhalten. geschäftsmann, der bargeldbanknoten im büro hält. — заработная плата фото и фотографииDer junge Mann wartete darauf, vom Chef Gehalt oder Lohn zu…
überraschte frau mit afro-frisur in grünem casual-style-pullover, die sparschwein und papierhaus in den handen hält und immobilien kauft. — заработная плата фото и фотографииÜberraschte Frau mit Afro-Frisur in grünem Casual-Style-Pullover,
евробанкноты, европейские банкноты, гель, ersparnisse, börse, bargeld verschiedener banknoten — зарплата фотографии и фотографииEuro-Banknoten , europäische Währung, Geld, Ersparnisse, Börse,…
человек, die türkische banknoten zählt — оклад фото и фоточеловек, Die Türkische Banknoten Zählt
Scharme Frau Hand Öffnet Leere Geldbörse auf der su suce nach geld für kreditkartenschulden — зарплата.Geld für Start-up, Business-Konzept
Geld für Startup, Startkapital für Geschäftskonzept
vergleichen von lohn- und steuerunterschieden — окладные фото и фотографииVergleichen von Lohn- und Steuerunterschieden
Vergleichen Sie Lohnunterschiede und Steuerunterschiede. Gleiches Entgelt
geld dünne linie icon set serie — зарплата стоковая графика, -clipart, -cartoons und -symbolegeld dünne linie icon set серия
Bonuskarte im umschlag mit rotem band und sparschwein — pay stock-fotos und bilderBonuskarte im Umschlag с ротем Band und Sparschwein
Британские банкноты, окрашенные в синие джинсы — оклад, фото и фотографииБританские банкноты, окрашенные в синие джинсы,
Инфляция. das Wort Inflation wird von verschiedenen wörtern umrahmt, die das phänomen beschreiben, wie steigende zinssätze und preise für rohstoffe und konsumgüter.
Об авторе