Мир искусственного интеллекта в Kinect



Компания Майкрософт Research анонсировала свое видео и научную работу, над которой она очень долго работала. Суть работы такова, она будет отражать саму алгоритмическую работу отслеживания компонентов тела в Kinect – это точно так же великолепно и изумительно, как уже многие найденные применения ему.

Такой огромный шаг и прорыв в Kinect – обеспечил определенное количество так называемых составляющих!!! Его начинка, или как многие называют «железо» очень тщательно продумано, которое способно выполнять ряд функций за определенные суммы. Сама сумма зависит от количества возможного выполнения функций и т.д. Но не стоит забывать, что после того, как пройдет весь ажиотаж и восторг от скоростного измеряющего глубины железа, это внимание и ажиотаж неизбежным образом привлекает такой способ, которым Kinect способен отслеживать человеческое тело и многие частицы тела. В этом случае тогда, наряду со всем, самым главным героем предстает , весьма классический случай и методика по распознания организмов и образов, которая реализуется с тончайшим изяществом!!!

Технологические устройства, которые отвечают за положение тела, были выпущены еще раньше, но все же, их самой большой проблемой является то, что человек должна встать в специальную позу, после чего алгоритм начинает сопоставлять человеческое тело при помощи самого простого сопоставления. Далее происходит алгоритм слежения, который производит следование за человеческими движениями тела. Самая главная идея: если мы в первом кадре имеем область, идентифицированную, например как рука, то уже в последующем кадре руку невозможно передвинуть очень далеко, и следовательно на почве этого, мы просто будем пытаться идентифицировать области, которые лежат ближе всего.

Алгоритмы, которые следят за движением вашего тела, очень хорошо применимы в теории, но на практике, они зачастую дают сбои, если положение организма по каким-либо причинам потеряно, и очень плохо алгоритмы справляются с другими телами или объектами, загораживающими отслеживаемого организма, даже на очень малое время. Кроме этого всего, само отслеживание нескольких объектов очень затруднено, и из-за такой утери следа, восстановить его можно только через длительное время, или совсем просто не удается, так как процесс является по сути важным и сложным. Но зачастую логичнее всего бывает вернуться к исходным данным.

И возникает вопрос: Что же тогда работники компании Microsoft Research сделали с данной проблемой? Благодаря чему Kinect стал работать намного лучше и продуктивнее, не подвергаясь некоторым ошибкам???

Для начала, они постарались вернуться к самому началу, и решено было построить систему, которая будет распознавать человеческое тело, но она не будет зависеть от слежения, а лишь будет находить определенные стороны и части тела, все будет происходить благодаря тому, что система будет основываться на локальном анализе каждой пикселизации. Самое обычное распознание тела и образа работает при помощи специфичной структуры, которая принимает решения, и обученной на большом количестве образцов. Для того, чтобы она работала, обычно необходимо представлять классификатор с огромным числом значений признаков, которые в свою очередь, как вы себе все представляете, имеют в себе информацию, которая необходимо непосредственно для распознания тела. В большинстве случаях, задача выбора признаков информативного характера – и является самой огромной и сложной задачей в распознании объектов.

Эти признаки, которые были выбраны, могут вас очень удивить, так как они являются весьма простыми, но далеко не очевидными в плане информативной деятельности для распознания и идентификации частей человеческого организма. После выбора, все признаки выявляются из простой формулы:

f = d( x + u/d(x) ) — d( x + v/d(x) ) ;

где у нас u and v –это парные векторы смещения, а вот d(x) – это уже глубина пикселя. Что мы видим в этом случае? Это значит расстояние от Kinect до конечной точки, которая проецируется на x. На самом деле, это самый простой признак, и по сути это всего лишь разница изменения в глубине двух пикселей, которые имеют свое смещение по отношению начального u and v. Варьируя u and v, выявляется так называемый набор признаков. В самих работах все более точно и понятно расписано, где модно найти полную информацию в развернутом виде.




Далее следует сказать, что единственным усложнением является то, смещение нормировано с глубиной положения исходного(первоначального) пикселя, то есть, имеет деление на d(x). Благодаря этому, происходит смещения независимыми от глубины положения и сопоставляет их с видимыми размерами объекта.

Все довольно ясно, ведь признаки измеряют что-то, что может быть связано с трехмерной формой областного пикселя вокруг тела. Но возникает вопрос: будет ли их достаточно, для возможности отличить, ну к примеру руку от ноги? Но это уже вопрос в другом…

Последующий этап, полученной командой - это принципы обучения разнообразия классификатора, который имеет название «лес решений», то есть скопление деревьев решаемых путей. Далее следует отметить, что именно каждое дерево обучалось на слитии признаков с глубинными изображениями, которых в свою очередь уже заранее привязали к соответствующим объектам, или иначе говоря, которых привязали к специальным частям тела. В общем деревья вели перестроения до того времени, пока они не начали выпускать нужную и правильную классификацию для отдельной части тела на наборе изображений тестового характера. Обучение всего трех деревьев на один миллион изображений. Все происходило на тысяче – ядерном кластере, и весь процесс занимал более одной сутки. На самом деле процесс очень длительный и кропотливый, но зато имеет свои преимущества, благодаря этому процессу, возможно, будет избегать большое количество непредвиденных ошибок.

Уже после всего, обученные классификаторы выдают серию вероятностей по принадлежности пикселей в определенных частях тела, и уже следующая составная часть алгоритмической функции всего лишь выбирает такие области с максимальной вероятностью для части определенного типа. Для примера рассмотрим ногу. Область будет отнесена к категории «нога», и если так называемый «ножной» классификатор определил максимальный порог вероятности именно этой области. То конечная стадия – это расчеты представляемого местоположения суставов человеческого организма по отношению к областям, которые в свою очередь были опознаны как определенные объекты или части тела. На данной диаграмме максимальные вероятности для разных частей человеческого организма обозначены будут цветными областями:




Не возможно не заметить, что это вычислить довольно – таки просто, если есть значение глубины хотя бы для трех пикселей и после чего мы смело применяем систему GPU. Наряду с этим изменением, система способна обрабатывать более двух сот кадров за одну секунду, и самое главное она не требует исходной эталонной позы, благодаря тому, что каждый кадр обрабатывается и анализируется независимо, и нет слежения такового, то и нет проблемных участков при потере изображения объекта. Более того, можно добавить, что возможна обработка нескольких тел одновременно, благодаря чему работа ускоряется.
Kinect - на самом деле стало очень важным достижением. И более того оно основано на весьма классическом и стандартном распознании объектов, но сам успех заключен в грамотном применении. Не стоит забывать, и обязательно взять во внимание, что доступность огромной многоядерной мощности вычисления, благодаря которой удалось сделать обучающее множество невероятно большим. Эта был один из принципов распознавания, что можно истратить многие годы, а то и века на обучение, но сама классификационная работа способна выполнятся довольно быстро. Скорее всего, мы уже вступаем в «золотой век», когда мощь вычислительной системы, нужна очень для работ при распознавании объектов и образов человеческого тела, а так же и машинного обучения, в итоге сделает их практичными.

52 комментария:

  1. Современные информационные технологии не перестают удивлять все новыми возможностями,но самым важным в этом есть то, чтобы дальнейшие достижения Человека были направлены в мирных целях.

    ОтветитьУдалить
  2. Вот так вот развивается и компҗтерная технология...Спасибо за инфу

    ОтветитьУдалить
  3. Стоит лишь удивляться все большему прорыву интернет-индустрии...Распознавание объектов конечно поможет во многих работах. А если все это представить в играх? Возможно скоро появятся игры, где игрок будет действительно реальным действующим лицом...

    ОтветитьУдалить
  4. И правда. На самом деле всё гениальное просто! Но алгоритм распознавания, созданный удачно не сможет на все сто решить задачу без "упомянутого в суе железа"! Для примера - возьми четырёх(восьми, десяти...) ядерный комп, поставь слабенькую видеокарту и попробуй какую нибудь супер - пупер игрушку! На выходе будет просто большой облом!

    ОтветитьУдалить
  5. Многое слышал о новых технологиях. Вот технология, представленная в этой статье хорошо удивила и порадовала - большое спасибо за информацию. Всё очень продумано и по-настоящему гениально! Будем ждать ещё новых технологий, несмотря на их изрядное количество.

    ОтветитьУдалить
  6. Новые технологии не перестают удивлять человечество...
    С каждым годом мы всё ближе приближаемся к пику технологий.Я думаю через некоторое время мы достигнем пика своих возможностей и они будут очень положительными!

    ОтветитьУдалить
  7. ato naverno pervii shag k postroike novih robotov... s takoi udivitelinoi funktii on smojet raspoznovati hozeaen, viponlneati domashnie raboti... pream kak v filme ya robot :)

    ОтветитьУдалить
  8. Принцип технологии заключается в использовании системы предвидения движений человека на основе искусственного интеллекта.

    ОтветитьУдалить
  9. Да, согласен, что благодаря таким технологиям не за горами новое поколение роботов. Которые более толково ориентируются в пространстве. А вообще, приятно, что человечество не стоит на месте, а движется вперед.

    ОтветитьУдалить
  10. Действительно, Kinect это новый виток эволюции технического прогресса в области распознавания образов! Microsoft - молодцы!

    ОтветитьУдалить
  11. Это очень скоро меня уличная видеокамера начнет узнавать. Еще и здороваться с ней придется. Правда, все новое у нас медленно внедряется. Это шутка. Но, мне кажется, что область применения Kinect еще до конца не определена. Она намного шире, чем сейчас можно себе представить.

    ОтветитьУдалить
  12. Новые технологии удивляют людей все больше и больше!Но мы никогда не достигнем (пика) своих технологий! Мы постоянно будем их улучшать!

    ОтветитьУдалить
  13. вот опять что новое изобрели с пользой для человека
    хороший прогресс

    ОтветитьУдалить
  14. Я служил в пограничных войсках. Я о том, что технологии Kinect могут найти широкое применение в этих войсках при охране государственной границы.

    ОтветитьУдалить
    Ответы
    1. Хорошо бы применить технологии Kinect в борьбе против террористов.

      Удалить
  15. Я думаю в будущем это будет полезная вещь,тогда не надо будет носить с собой ключи от дома,гаража,автомобиля...если только человечество доживет до этого(21.12.2012)

    ОтветитьУдалить
  16. Уже есть игровые приставки с использованием технологии Kinect, но даже в них ещё есть прорехи в использовании, но если найдут выход в проблеме, человечество шагнёт вперёд оооочень

    ОтветитьУдалить
  17. очерь pадует, что microsoft анонсировали kinect для PC/ безусловно, ля геймеров это большое достижение, но привязывать к нему какие-то глобальные задачи(как например открытие дверей без ключа и тп), просто бессмысленно! для этого проще использовать сканер отпечатка пальца

    ОтветитьУдалить
  18. Интересно то что kinect используют не только в игровыхсферах, но и в науки,в частности медицине...

    ОтветитьУдалить
  19. Когда читаешь такие статьи, то по настоящему начинаешь осозновать - МЫ живём в ХХI веке!!!
    Это всегда радует. И не много грустно, что не всем по карману пользоваться плодами научных изобретений.

    ОтветитьУдалить
  20. Да..это очень большой прорыв для Microsoft.Гениальная задумка,хорошо продуманная технология,это вам не джойстик для xbox.Работники компании Microsoft должны быть довольными за свой труд!

    ОтветитьУдалить
  21. Мне кажется эту технологию можно с успехом применять для съемки фантастических фильмов, вроде "Аватара", где используется технология захвата движений.

    ОтветитьУдалить
  22. В начале 80-x вычерчивание обыкновенной сферы, которая сейчас в программах типа 3ds Max делается двумя кликами, длилось от 12 до 14 минут. Техника развивается и у этой технологии еще все впереди.

    ОтветитьУдалить
  23. ДА.. офигенно придумали..,технология классная, но однозначно требует доработки... потому что при использовании проявляется довольно много мелких погрешностей... что немного портит картину.. а так идея классная... доработать и всё будет офигенно..)

    ОтветитьУдалить
  24. Ничего гениального!подобная разработка так же принадлежит компании Sony,и кроме упращения фиксации положения тела ничего нового!

    ОтветитьУдалить
  25. Подобную разработку я где-то видел, но я не перестаю удивляться, главное чтобы эти разработки использовались только в мирных целях

    ОтветитьУдалить
  26. Это что из мира фантастики. Если все таки такие технологии разовьются, то по моему мнению их значение неоценимо, хотя сейчас даже трудно представить как это все будет происходить. Хотелось бы узнать в будущем.

    ОтветитьУдалить
  27. Я почему-то сомневаюсь, что "отслеживание компонентов тела" (ох и формулировка =) - это небось на случай, если человека "разберет от любопытства?") на данный момент находится на высоком уровне. Скорее всего - пока эта технология интересна конечному пользователю лишь своим существованием. А применять ее как минимум проблематично по причине ее "сырости". ИМХО.

    ОтветитьУдалить
  28. Прогресс в сфере высоких технологий всё больше и больше делает свои шаги и уже, наверно, не за горами то время когда люди будут заниматься тем, чем хотят, а всю работу выполнять будут либо роботы, либо какие-нибудь суррогаты(аватары). Утопия, но кто знает...

    ОтветитьУдалить
  29. Сначала мы видели массовый выход на рынок портативных устройств с сенсорными экранами, теперь будем наблюдать, как исчезнут посредники между нами и ПК.

    ОтветитьУдалить
  30. Очень приятно видеть скоротечное развитие беспроводных модулей как Kinect, радует тому сколько еще смогут создать разных гаджетов которые будут облегчать повседневные задачи. И еще то самое что Kinect открывает новые возможности в видеоиграх.

    ОтветитьУдалить
  31. Блог мне очень понравился!И меня очень радует развитие современных технологий ! Спасибо всем!

    ОтветитьУдалить
  32. Думаю что беспроводные модули Kinect и подобные им- это новый шаг в развитии компьютерных технологий,будущее за ними.

    ОтветитьУдалить
  33. Наиболее новые и прогрессивные технологии в современности относят к высоким технологиям .у этой технологии еще все впереди....

    ОтветитьУдалить
  34. Очень хорошая статья,Браво автор

    ОтветитьУдалить
  35. Попытки сделать подобное уже были, однако до идеала доведены, как видно из публикации, лишь сейчас. Компьютерный манипулятор типа Мышь в скором времени, по логике, должен уйти в том же направление, что и пяти и трёхдюймовые дисководы, правда, если эта технология приживётся всерьёз.

    ОтветитьУдалить
  36. Новые достижения компьютерных технологий радуют конечно нас пользователей что еще новое придумают это наверное на грани фантастики

    ОтветитьУдалить
  37. Новые технологии никогда меня не пересают удивлять.Раньше помню как на игромании вычитал/просмотрел на диске как люди играю в видео игры.Это потрясно.

    ОтветитьУдалить
    Ответы
    1. Очень интересная статья! Я даже и не подозревала, что техногии движутся вперед такими темпами!!! Спасибо большое за информацию!!

      Удалить
  38. Современные информационные технологии не перестают удивлять все новыми возможностями,но самым важным в этом есть то, чтобы дальнейшие достижения Человека были направлены в мирных целях.

    ОтветитьУдалить
  39. Да новые технологии не перестают удивлять

    ОтветитьУдалить
    Ответы
    1. мир новых технологий оставляет желать лучшего...в скором времени новые технологии "завоюют мир". я считаю, что с их помощью человечество приблизится к идеалу и совершенству

      Удалить
    2. Хотя прогресс и не остановишь, но вряд ли все это ведет к идеалу и совершенству. Нобель тоже придумал динамит для облегчения работы шахтеров, а в итоге изобрел страшную штуку. Но надеяться на лучшее стоит.

      Удалить
  40. Да уж Kinect и PS Move не перестают удивлять, скоро из виртуального мира невылезем...

    ОтветитьУдалить
  41. А стоит ли удивляться?С каждым днем все больше новинок появляется.Через несколько лет, а может и раньше наверняка увидим этот продукт в магазинах... 3d технологии относительно недавно появились на рынке,а им уже готовят замену!

    ОтветитьУдалить
  42. На самом деле такие технологие это новый шаг в будущие,где роботы полностью смогут заменить человека на производствах.

    ОтветитьУдалить
  43. Существует множество ниш для создания уникальных сценариев поведения. Эти ниши были созданы новыми технологиями. Также существует широкий выбор технологий, где можно использовать полученные в ходе исследований результаты, проверяя и редактируя разработанную модель алгоритма. При рассмотрении средств для исследования сценариев поведения в интерактивных комплексах в онлайн следует склониться в сторону технологии AlternativaPlatform с использованием Adobe Molehill, так как данные технологии являются перспективными и имеют хорошую поддержку. В настольных решениях для исследования предпочтительно использовать Microsoft Kinect и XNA Games.

    ОтветитьУдалить
  44. Как сказал Eskobarikkk роботы заменят человека на производстве, а не становиться ли страшным такое бурное развитие компьютерной техники. Не кажется ли вам что будущее освещенное в "терминаторе - 2" не за горами ?

    ОтветитьУдалить
  45. Очень интересная статья.. Узнала много интересного для себя.. Радует, что человечество движется к самосовершенствованию и выдвигает новые идеи...

    ОтветитьУдалить
  46. Это - большой прорыв, ведь на базе этой технологии будут, наверное, создаваться не только отличные игры и фильмы, но и робототехника нового поколения.

    ОтветитьУдалить
  47. Спасибо за статью! всегда интересно узнавать и познавать что-то новое. Компанию Майкрософт я всегда уважал. Мир не стоит не месте, что же будет лет через 10?

    ОтветитьУдалить
  48. В процессе работы над компьютерной графики используется огромное количество самых разнообразных технологий. Не все об этом знают, но даже для создания игровой флоры и фауны используются специальные наработки, снижающие нагрузки на игровой движок.так что огромный респект за статью и за новый прогресс.Спасибо за инфo.

    ОтветитьУдалить