Част от всичко, публикуван наскоро от Facebook Research, прави нещо, което повечето хора, потопени в компютърното зрение, намират за плашещо: надеждно да знаят кои пиксели в изображението принадлежат на даден обект. Улесняването на това е целта на Segment Anything Model (SAM), който наскоро беше пуснат под лиценза Apache 2.0.
Резултатите изглеждат страхотни и са налице Предлага се интерактивна презентация Можете да играете с различните начини, по които работи SAM. Човек може да избира неща, като посочи и щракне върху изображение или изображенията могат да бъдат разделени автоматично. Честно казано, впечатляващо е да видите как SAM прави маскирането на различни обекти в изображение толкова лесно. Това, което прави това възможно, е машинното обучение и част от това е фактът, че моделът зад системата е обучен на огромен набор от данни от висококачествени изображения и маски, което я прави изключително ефективна в това, което прави.
След като изображението бъде сегментирано, тези маски могат да се използват за взаимодействие с други системи, като например откриване на обект (което идентифицира и класифицира какъв е обектът) и други приложения за компютърно зрение. Тази система работи по-мощно, ако в крайна сметка те наистина знаят къде да търсят. това Публикация в блог от Meta AI Той навлиза в някои допълнителни подробности за това какво е възможно със SAM, пълни подробности изследователска работа.
Такива системи разчитат на висококачествени набори от данни. Разбира се, нищо не е по-добро от много данни от реалния свят, но също така видяхме, че е възможно да генерираме автоматизирани данни, които всъщност не съществуват, и да получим полезни резултати.
„Internet trailblazer. Travelaholic. Страстен евангелист в социалните медии. Защитник на телевизията.“
More Stories
Новото музикално приложение на Nintendo е клонинг на YouTube Music
2027 Pixel Tablet ‘3’ може да има втори USB-C порт
Това е документът, който никой не прочете, преди да обяви смъртта на съвременната криптография