PRKernel

Доставчик на новини в реално време в България, който информира своите читатели за последните български новини, събития, информация, пътувания, България.

Следващият етап от търсенето с Google: контекстът е крал

На своето събитие Search On днес Google представи няколко нови функции, които, взети заедно, са най -силният опит досега да накара хората да направят нещо повече от това да въведат няколко думи в полето за търсене. Използвайки новата си технология за машинно обучение за Универсалния многозадачен модел (MUM) по малки начини, компанията се надява да започне добродетелен цикъл: Тя ще предостави повече подробности и богати на контекст отговори, а в замяна се надява потребителите да попитат повече подробности и богати на контекст въпроси. Компанията се надява, че крайният резултат ще бъде по -богато и задълбочено търсене.

Старши вицепрезидент на Google Прабхакар Рагаван наблюдава търсенето заедно с помощник, рекламата и други продукти. Той обича да казва – и повтори в интервю миналата неделя – че „изследванията не са решен проблем“. Това може и да е вярно, но проблемите, които той и екипът му се опитват да разрешат сега, не са толкова за кавгите в мрежата, а повече за добавяне на контекст към това, което намират там.

От своя страна Google ще започне да демонстрира способността си да разпознава групи теми, свързани с използването на машинно обучение, и да ви ги представя организирано. Предстоящият редизайн на Google Търсене ще започне да показва кутии „Неща, които трябва да знаете“, които ви изпращат към различни подтеми. Когато има част от видеоклип, която е от значение за общата тема – дори когато това не е видеото като цяло – ще бъдете изпратени там. Резултатите от вашето пазаруване ще започнат да показват наличност в близките магазини и дори дрехи в различни стилове, свързани с вашето търсене.

От ваша страна, въпреки че терминът „въпрос“ вероятно е по -добър, Google предлага нови начини за търсене извън текстовото поле. Той прави голям тласък да премести софтуера за разпознаване на изображения на Google Lens на повече места. Той ще бъде включен в приложението Google за iOS, както и в уеб браузъра Chrome на настолни устройства. С MUM Google се надява да накара потребителите да направят нещо повече от идентифициране на цветя или забележителности, но вместо това използват Lens директно, за да задават въпроси и да пазаруват.

„Това е цикъл, който според мен ще продължи да ескалира“, казва Рагхаван. „Повече технологии водят до повече достъпност на потребителите, до по -добро изразяване на потребителите и ще изискват повече от нас технически.“

Google Lens ще позволи на потребителите да търсят с помощта на изображения и да прецизират заявката си с текст.
Изображение: google

Тези два аспекта на уравнението за търсене имат за цел да стартират следващата фаза на търсенето с Google, тъй като алгоритмите за машинно обучение стават все по-забележими в процеса чрез организиране и представяне на информация директно. В тази връзка усилията на Google ще бъдат силно подпомогнати от последните постижения в обработката на езици с изкуствен интелект. Благодарение на системите, известни като големи езикови модели (MUM е една от тях), машинното обучение е много по -добро при картографиране на връзките между думи и теми. Това са уменията, които компанията използва, за да направи изследванията не само по -точни, но и по -проучвателни и, надявам се, по -полезни.

Един пример от Google е полезен. Може да нямате първата представа за името на частите на вашия мотор, но ако нещо е счупено, ще трябва да знаете. Google Lens може визуално да идентифицира дерайльора (частта за превключване на предавките, която виси близо до задното колело) и вместо просто да ви даде отделна информация, ще ви позволи да зададете въпроси относно поправянето на това нещо директно и ще ви отведе до информацията (в този случай отлично) youtube топ перм канал).

Налагането на повече потребители да отварят Google Lens по -често е чудесно само по себе си, но по -голямата картина (така да се каже) е, че Google се опитва да събере повече контекст около вашите заявки. По -сложните мултимедийни търсения, които комбинират текст и изображения, изискват „напълно различно ниво на конфигурация за контекста, който трябва да имаме от доставчика, и следователно ни помага изключително много, за да получим възможно най -голям контекст“, казва Рагхаван.

Ние сме далеч от така наречените „10 сини връзки“ на резултатите от търсенето, които Google предоставя. Той показва информационни кутии, резултати от изображения и директни отговори от дълго време. Днешните реклами са крачка напред, тъй като информацията, която Google предоставя не е само етикет с подходяща информация, а обобщение на това, което нейните машини разбират, като изстъргват мрежата.

В някои случаи – например при пазаруване – тази дестилация означава, че вероятно ще изпратите повече показвания на страници до Google. Както при Lens, важно е да наблюдавате тази тенденция: търсенията в Google все повече ви тласкат към собствените продукти на Google. Но и тук има по -голяма опасност. Фактът, че Google ви казва повече неща, директно увеличава тежестта, която винаги носите: говорене с по -малко пристрастия.

С това имам предвид пристрастия в две различни значения. Първият е технически: Моделите за машинно обучение, които Google иска да използва за подобряване на търсенето, имат добре документирани проблеми с расовите и половите пристрастия. Те са обучени, като четат големи части от мрежата и в резултат на това са склонни да разпознават лошите начини на говорене. Проблемите на Google с етичния екип на AI са добре документирани на този етап – това е Двама старши изследователи уволниха След като публикуваха статия по тази тема. Като вицепрезидент по търсенето в Google, Панду Наяк каза ръбът‘с Джеймс Винсънт в статията си за днешните съобщения на MUMGoogle разбира, че всички езикови модели имат пристрастия, но компанията вярва, че може да избегне „разпространението им пред хората за директна консумация“.

Нова функция, наречена „Неща, които трябва да знаят“, ще помогне на потребителите да изследват теми, свързани с техните търсения.
Изображение: google

Каквото и да е (и за да бъде ясно, може и да не е) избягва друг въпрос за зависимост и друг вид пристрастия. Когато Google започне да ви разказва повече за техните собствени комбинации от информация, от каква гледна точка говорите? Като журналисти често говорим за това, че така нареченият „поглед от нищото“ е неподходящ начин за представяне на нашия репортаж. Какво е мнението на Google? Това е проблем, с който компанията се е сблъсквала в миналото, и понякога е известен като проблема с „един истински отговор“. Когато Google се опитва да даде на хората кратки, категорични отговори с автоматизирани системи, това често се оказва Публикувайте лоша информация.

Въвеждайки този въпрос, Рагхаван отговаря, като посочва сложността на съвременните езикови парадигми. „Почти всички езикови парадигми, ако ги погледнете, са сватби в пространство с големи размери. Някои части от тези пространства са по-надеждни, а някои части по-малко надеждни. Можем да оценим механично тези неща доста лесно. Предизвикателството е , казва Raghavan. Как да въведем част от тази сложност на потребителя, без да ги объркваме.

Но чувствам, че истинският отговор е, че поне засега Google прави всичко възможно, за да избегне поставянето на въпроса за гледната точка на своята търсачка, като избягва области, в които би могъл да бъде обвинен, по думите на Raghavan, „прекомерно редактиране“ . Често, когато говорят с ръководителите на Google за тези пристрастия и проблеми с доверието, те се фокусират върху лесно разпознаваеми части от тези пространства с големи размери като „надеждност“.

Например новите полета на Google „Неща, които трябва да знаете“ няма да се появят, когато някой търси неща, които Google е определил като „особено вредни/чувствителни“, въпреки че говорителят каза, че Google „не разрешава или блокира определени регулирани категории“. нашите системи са в състояние да разберат какви теми тези видове функции трябва или не трябва да се показват. „

Търсенето на Google, неговите входове и изходи, неговите алгоритми и езиковите му модели станаха почти невъобразимо сложни. Когато Google ни казва, че може да разбере съдържанието на видеоклиповете сега, ние считаме, че разполага с изчислителните възможности, за да го постигне – но истината е, че дори индексирането на такава огромна колекция е огромна задача, която затъмнява първоначалната задача за индексиране на ранната мрежа. (Google индексира само аудио скриптове за подмножество YouTube, за запис, въпреки че с MUM те имат за цел да правят визуално индексиране и други видео платформи в бъдеще.)

Често, когато говорите с компютърни учени, проблем с търговеца ще се появи. Това е известен пъзел, в който се опитвате да изчислите възможно най -краткия маршрут между даден брой градове, но също така е богата метафора за мислене как компютрите извършват своите машинации.

„Ако ми дадете всички машини по света, мога да реша доста големи случаи“, казва Рагхаван. Що се отнася до изследването, той казва, че то е нерешено и вероятно не може да бъде разрешено, след като отново му бъдат хвърлени компютри. Вместо това Google трябва да разработи нови подходи, като MUM, които да използват по -добре ресурсите, които Google може реално да създаде. „Ако ми дадеш всички машини там, пак щях да бъда ограничен от човешкото любопитство и моето осъзнаване.“

Новите начини за разбиране на информацията на Google са впечатляващи, но предизвикателството е какво ще направите с информацията и как ще я представите. Най -смешното в проблема с търговския пътник е, че никой не спира и не пита какво точно има в случая, какво показва той на всичките си клиенти, докато отива от врата до врата?