Мир искусственного интеллекта в Kinect
Компания Майкрософт Research анонсировала свое видео и научную работу, над которой она очень долго работала. Суть работы такова, она будет отражать саму алгоритмическую работу отслеживания компонентов тела в Kinect – это точно так же великолепно и изумительно, как уже многие найденные применения ему.
Такой огромный шаг и прорыв в Kinect – обеспечил определенное количество так называемых составляющих!!! Его начинка, или как многие называют «железо» очень тщательно продумано, которое способно выполнять ряд функций за определенные суммы. Сама сумма зависит от количества возможного выполнения функций и т.д. Но не стоит забывать, что после того, как пройдет весь ажиотаж и восторг от скоростного измеряющего глубины железа, это внимание и ажиотаж неизбежным образом привлекает такой способ, которым Kinect способен отслеживать человеческое тело и многие частицы тела. В этом случае тогда, наряду со всем, самым главным героем предстает , весьма классический случай и методика по распознания организмов и образов, которая реализуется с тончайшим изяществом!!!
Технологические устройства, которые отвечают за положение тела, были выпущены еще раньше, но все же, их самой большой проблемой является то, что человек должна встать в специальную позу, после чего алгоритм начинает сопоставлять человеческое тело при помощи самого простого сопоставления. Далее происходит алгоритм слежения, который производит следование за человеческими движениями тела. Самая главная идея: если мы в первом кадре имеем область, идентифицированную, например как рука, то уже в последующем кадре руку невозможно передвинуть очень далеко, и следовательно на почве этого, мы просто будем пытаться идентифицировать области, которые лежат ближе всего.
Алгоритмы, которые следят за движением вашего тела, очень хорошо применимы в теории, но на практике, они зачастую дают сбои, если положение организма по каким-либо причинам потеряно, и очень плохо алгоритмы справляются с другими телами или объектами, загораживающими отслеживаемого организма, даже на очень малое время. Кроме этого всего, само отслеживание нескольких объектов очень затруднено, и из-за такой утери следа, восстановить его можно только через длительное время, или совсем просто не удается, так как процесс является по сути важным и сложным. Но зачастую логичнее всего бывает вернуться к исходным данным.
И возникает вопрос: Что же тогда работники компании Microsoft Research сделали с данной проблемой? Благодаря чему Kinect стал работать намного лучше и продуктивнее, не подвергаясь некоторым ошибкам???
Для начала, они постарались вернуться к самому началу, и решено было построить систему, которая будет распознавать человеческое тело, но она не будет зависеть от слежения, а лишь будет находить определенные стороны и части тела, все будет происходить благодаря тому, что система будет основываться на локальном анализе каждой пикселизации. Самое обычное распознание тела и образа работает при помощи специфичной структуры, которая принимает решения, и обученной на большом количестве образцов. Для того, чтобы она работала, обычно необходимо представлять классификатор с огромным числом значений признаков, которые в свою очередь, как вы себе все представляете, имеют в себе информацию, которая необходимо непосредственно для распознания тела. В большинстве случаях, задача выбора признаков информативного характера – и является самой огромной и сложной задачей в распознании объектов.
Эти признаки, которые были выбраны, могут вас очень удивить, так как они являются весьма простыми, но далеко не очевидными в плане информативной деятельности для распознания и идентификации частей человеческого организма. После выбора, все признаки выявляются из простой формулы:
f = d( x + u/d(x) ) — d( x + v/d(x) ) ;
где у нас u and v –это парные векторы смещения, а вот d(x) – это уже глубина пикселя. Что мы видим в этом случае? Это значит расстояние от Kinect до конечной точки, которая проецируется на x. На самом деле, это самый простой признак, и по сути это всего лишь разница изменения в глубине двух пикселей, которые имеют свое смещение по отношению начального u and v. Варьируя u and v, выявляется так называемый набор признаков. В самих работах все более точно и понятно расписано, где модно найти полную информацию в развернутом виде.
Далее следует сказать, что единственным усложнением является то, смещение нормировано с глубиной положения исходного(первоначального) пикселя, то есть, имеет деление на d(x). Благодаря этому, происходит смещения независимыми от глубины положения и сопоставляет их с видимыми размерами объекта.
Все довольно ясно, ведь признаки измеряют что-то, что может быть связано с трехмерной формой областного пикселя вокруг тела. Но возникает вопрос: будет ли их достаточно, для возможности отличить, ну к примеру руку от ноги? Но это уже вопрос в другом…
Последующий этап, полученной командой - это принципы обучения разнообразия классификатора, который имеет название «лес решений», то есть скопление деревьев решаемых путей. Далее следует отметить, что именно каждое дерево обучалось на слитии признаков с глубинными изображениями, которых в свою очередь уже заранее привязали к соответствующим объектам, или иначе говоря, которых привязали к специальным частям тела. В общем деревья вели перестроения до того времени, пока они не начали выпускать нужную и правильную классификацию для отдельной части тела на наборе изображений тестового характера. Обучение всего трех деревьев на один миллион изображений. Все происходило на тысяче – ядерном кластере, и весь процесс занимал более одной сутки. На самом деле процесс очень длительный и кропотливый, но зато имеет свои преимущества, благодаря этому процессу, возможно, будет избегать большое количество непредвиденных ошибок.
Уже после всего, обученные классификаторы выдают серию вероятностей по принадлежности пикселей в определенных частях тела, и уже следующая составная часть алгоритмической функции всего лишь выбирает такие области с максимальной вероятностью для части определенного типа. Для примера рассмотрим ногу. Область будет отнесена к категории «нога», и если так называемый «ножной» классификатор определил максимальный порог вероятности именно этой области. То конечная стадия – это расчеты представляемого местоположения суставов человеческого организма по отношению к областям, которые в свою очередь были опознаны как определенные объекты или части тела. На данной диаграмме максимальные вероятности для разных частей человеческого организма обозначены будут цветными областями:
Не возможно не заметить, что это вычислить довольно – таки просто, если есть значение глубины хотя бы для трех пикселей и после чего мы смело применяем систему GPU. Наряду с этим изменением, система способна обрабатывать более двух сот кадров за одну секунду, и самое главное она не требует исходной эталонной позы, благодаря тому, что каждый кадр обрабатывается и анализируется независимо, и нет слежения такового, то и нет проблемных участков при потере изображения объекта. Более того, можно добавить, что возможна обработка нескольких тел одновременно, благодаря чему работа ускоряется.
Kinect - на самом деле стало очень важным достижением. И более того оно основано на весьма классическом и стандартном распознании объектов, но сам успех заключен в грамотном применении. Не стоит забывать, и обязательно взять во внимание, что доступность огромной многоядерной мощности вычисления, благодаря которой удалось сделать обучающее множество невероятно большим. Эта был один из принципов распознавания, что можно истратить многие годы, а то и века на обучение, но сама классификационная работа способна выполнятся довольно быстро. Скорее всего, мы уже вступаем в «золотой век», когда мощь вычислительной системы, нужна очень для работ при распознавании объектов и образов человеческого тела, а так же и машинного обучения, в итоге сделает их практичными.
Подписаться на:
Сообщения (Atom)
Современные информационные технологии не перестают удивлять все новыми возможностями,но самым важным в этом есть то, чтобы дальнейшие достижения Человека были направлены в мирных целях.
ОтветитьУдалитьВот так вот развивается и компҗтерная технология...Спасибо за инфу
ОтветитьУдалитьСтоит лишь удивляться все большему прорыву интернет-индустрии...Распознавание объектов конечно поможет во многих работах. А если все это представить в играх? Возможно скоро появятся игры, где игрок будет действительно реальным действующим лицом...
ОтветитьУдалитьИ правда. На самом деле всё гениальное просто! Но алгоритм распознавания, созданный удачно не сможет на все сто решить задачу без "упомянутого в суе железа"! Для примера - возьми четырёх(восьми, десяти...) ядерный комп, поставь слабенькую видеокарту и попробуй какую нибудь супер - пупер игрушку! На выходе будет просто большой облом!
ОтветитьУдалитьМногое слышал о новых технологиях. Вот технология, представленная в этой статье хорошо удивила и порадовала - большое спасибо за информацию. Всё очень продумано и по-настоящему гениально! Будем ждать ещё новых технологий, несмотря на их изрядное количество.
ОтветитьУдалитьНовые технологии не перестают удивлять человечество...
ОтветитьУдалитьС каждым годом мы всё ближе приближаемся к пику технологий.Я думаю через некоторое время мы достигнем пика своих возможностей и они будут очень положительными!
ato naverno pervii shag k postroike novih robotov... s takoi udivitelinoi funktii on smojet raspoznovati hozeaen, viponlneati domashnie raboti... pream kak v filme ya robot :)
ОтветитьУдалитьПринцип технологии заключается в использовании системы предвидения движений человека на основе искусственного интеллекта.
ОтветитьУдалитьДа, согласен, что благодаря таким технологиям не за горами новое поколение роботов. Которые более толково ориентируются в пространстве. А вообще, приятно, что человечество не стоит на месте, а движется вперед.
ОтветитьУдалитьДействительно, Kinect это новый виток эволюции технического прогресса в области распознавания образов! Microsoft - молодцы!
ОтветитьУдалитьЭто очень скоро меня уличная видеокамера начнет узнавать. Еще и здороваться с ней придется. Правда, все новое у нас медленно внедряется. Это шутка. Но, мне кажется, что область применения Kinect еще до конца не определена. Она намного шире, чем сейчас можно себе представить.
ОтветитьУдалитьНовые технологии удивляют людей все больше и больше!Но мы никогда не достигнем (пика) своих технологий! Мы постоянно будем их улучшать!
ОтветитьУдалитьвот опять что новое изобрели с пользой для человека
ОтветитьУдалитьхороший прогресс
Я служил в пограничных войсках. Я о том, что технологии Kinect могут найти широкое применение в этих войсках при охране государственной границы.
ОтветитьУдалитьХорошо бы применить технологии Kinect в борьбе против террористов.
УдалитьЯ думаю в будущем это будет полезная вещь,тогда не надо будет носить с собой ключи от дома,гаража,автомобиля...если только человечество доживет до этого(21.12.2012)
ОтветитьУдалитьУже есть игровые приставки с использованием технологии Kinect, но даже в них ещё есть прорехи в использовании, но если найдут выход в проблеме, человечество шагнёт вперёд оооочень
ОтветитьУдалитьочерь pадует, что microsoft анонсировали kinect для PC/ безусловно, ля геймеров это большое достижение, но привязывать к нему какие-то глобальные задачи(как например открытие дверей без ключа и тп), просто бессмысленно! для этого проще использовать сканер отпечатка пальца
ОтветитьУдалитьИнтересно то что kinect используют не только в игровыхсферах, но и в науки,в частности медицине...
ОтветитьУдалитьКогда читаешь такие статьи, то по настоящему начинаешь осозновать - МЫ живём в ХХI веке!!!
ОтветитьУдалитьЭто всегда радует. И не много грустно, что не всем по карману пользоваться плодами научных изобретений.
Да..это очень большой прорыв для Microsoft.Гениальная задумка,хорошо продуманная технология,это вам не джойстик для xbox.Работники компании Microsoft должны быть довольными за свой труд!
ОтветитьУдалитьМне кажется эту технологию можно с успехом применять для съемки фантастических фильмов, вроде "Аватара", где используется технология захвата движений.
ОтветитьУдалитьВ начале 80-x вычерчивание обыкновенной сферы, которая сейчас в программах типа 3ds Max делается двумя кликами, длилось от 12 до 14 минут. Техника развивается и у этой технологии еще все впереди.
ОтветитьУдалитьДА.. офигенно придумали..,технология классная, но однозначно требует доработки... потому что при использовании проявляется довольно много мелких погрешностей... что немного портит картину.. а так идея классная... доработать и всё будет офигенно..)
ОтветитьУдалитьНичего гениального!подобная разработка так же принадлежит компании Sony,и кроме упращения фиксации положения тела ничего нового!
ОтветитьУдалитьПодобную разработку я где-то видел, но я не перестаю удивляться, главное чтобы эти разработки использовались только в мирных целях
ОтветитьУдалитьЭто что из мира фантастики. Если все таки такие технологии разовьются, то по моему мнению их значение неоценимо, хотя сейчас даже трудно представить как это все будет происходить. Хотелось бы узнать в будущем.
ОтветитьУдалитьЯ почему-то сомневаюсь, что "отслеживание компонентов тела" (ох и формулировка =) - это небось на случай, если человека "разберет от любопытства?") на данный момент находится на высоком уровне. Скорее всего - пока эта технология интересна конечному пользователю лишь своим существованием. А применять ее как минимум проблематично по причине ее "сырости". ИМХО.
ОтветитьУдалитьПрогресс в сфере высоких технологий всё больше и больше делает свои шаги и уже, наверно, не за горами то время когда люди будут заниматься тем, чем хотят, а всю работу выполнять будут либо роботы, либо какие-нибудь суррогаты(аватары). Утопия, но кто знает...
ОтветитьУдалитьСначала мы видели массовый выход на рынок портативных устройств с сенсорными экранами, теперь будем наблюдать, как исчезнут посредники между нами и ПК.
ОтветитьУдалитьОчень приятно видеть скоротечное развитие беспроводных модулей как Kinect, радует тому сколько еще смогут создать разных гаджетов которые будут облегчать повседневные задачи. И еще то самое что Kinect открывает новые возможности в видеоиграх.
ОтветитьУдалитьБлог мне очень понравился!И меня очень радует развитие современных технологий ! Спасибо всем!
ОтветитьУдалитьДумаю что беспроводные модули Kinect и подобные им- это новый шаг в развитии компьютерных технологий,будущее за ними.
ОтветитьУдалитьНаиболее новые и прогрессивные технологии в современности относят к высоким технологиям .у этой технологии еще все впереди....
ОтветитьУдалитьОчень хорошая статья,Браво автор
ОтветитьУдалитьПопытки сделать подобное уже были, однако до идеала доведены, как видно из публикации, лишь сейчас. Компьютерный манипулятор типа Мышь в скором времени, по логике, должен уйти в том же направление, что и пяти и трёхдюймовые дисководы, правда, если эта технология приживётся всерьёз.
ОтветитьУдалитьНовые достижения компьютерных технологий радуют конечно нас пользователей что еще новое придумают это наверное на грани фантастики
ОтветитьУдалитьНовые технологии никогда меня не пересают удивлять.Раньше помню как на игромании вычитал/просмотрел на диске как люди играю в видео игры.Это потрясно.
ОтветитьУдалитьОчень интересная статья! Я даже и не подозревала, что техногии движутся вперед такими темпами!!! Спасибо большое за информацию!!
УдалитьСовременные информационные технологии не перестают удивлять все новыми возможностями,но самым важным в этом есть то, чтобы дальнейшие достижения Человека были направлены в мирных целях.
ОтветитьУдалитьДа новые технологии не перестают удивлять
ОтветитьУдалитьмир новых технологий оставляет желать лучшего...в скором времени новые технологии "завоюют мир". я считаю, что с их помощью человечество приблизится к идеалу и совершенству
УдалитьХотя прогресс и не остановишь, но вряд ли все это ведет к идеалу и совершенству. Нобель тоже придумал динамит для облегчения работы шахтеров, а в итоге изобрел страшную штуку. Но надеяться на лучшее стоит.
УдалитьДа уж Kinect и PS Move не перестают удивлять, скоро из виртуального мира невылезем...
ОтветитьУдалитьА стоит ли удивляться?С каждым днем все больше новинок появляется.Через несколько лет, а может и раньше наверняка увидим этот продукт в магазинах... 3d технологии относительно недавно появились на рынке,а им уже готовят замену!
ОтветитьУдалитьНа самом деле такие технологие это новый шаг в будущие,где роботы полностью смогут заменить человека на производствах.
ОтветитьУдалитьСуществует множество ниш для создания уникальных сценариев поведения. Эти ниши были созданы новыми технологиями. Также существует широкий выбор технологий, где можно использовать полученные в ходе исследований результаты, проверяя и редактируя разработанную модель алгоритма. При рассмотрении средств для исследования сценариев поведения в интерактивных комплексах в онлайн следует склониться в сторону технологии AlternativaPlatform с использованием Adobe Molehill, так как данные технологии являются перспективными и имеют хорошую поддержку. В настольных решениях для исследования предпочтительно использовать Microsoft Kinect и XNA Games.
ОтветитьУдалитьКак сказал Eskobarikkk роботы заменят человека на производстве, а не становиться ли страшным такое бурное развитие компьютерной техники. Не кажется ли вам что будущее освещенное в "терминаторе - 2" не за горами ?
ОтветитьУдалитьОчень интересная статья.. Узнала много интересного для себя.. Радует, что человечество движется к самосовершенствованию и выдвигает новые идеи...
ОтветитьУдалитьЭто - большой прорыв, ведь на базе этой технологии будут, наверное, создаваться не только отличные игры и фильмы, но и робототехника нового поколения.
ОтветитьУдалитьСпасибо за статью! всегда интересно узнавать и познавать что-то новое. Компанию Майкрософт я всегда уважал. Мир не стоит не месте, что же будет лет через 10?
ОтветитьУдалитьВ процессе работы над компьютерной графики используется огромное количество самых разнообразных технологий. Не все об этом знают, но даже для создания игровой флоры и фауны используются специальные наработки, снижающие нагрузки на игровой движок.так что огромный респект за статью и за новый прогресс.Спасибо за инфo.
ОтветитьУдалить