Большие данные – большие цели Intel

Опубликовано: 29.10.2013 20:52 | Автор: Александр Семёнов | Просмотров: 3078

16 октября 2013 года в Москве в рамках конференции сообщества IT Galaxy «Прикоснись к будущему» с докладом выступил директор российского представительства Intel по маркетингу Андрей Матвеев. Он рассказал о значимости «Больших данных» для будущего и для Intel.

Андрей Матвеев, директор российского представительства Intel по маркетингу. Конференция сообщества IT Galaxy «Прикоснись к будущему». Москва. 16 октября 2013 г. Фото: Александр Семёнов.

Цель презентации – показать направление движения Intel в ближайшие несколько лет. О том, что такое «Большие данные», сегодня слышали уже многие. Эта тема становится для корпорации Intel одной из самых важных, именно на этом направлении открываются самые большие возможности. Дело в том, что эта тема содержит в себе все то, чем занимается корпорация – и серверную инфраструктуру, и клиентские ПК, и сервисы, и обеспечение безопасности.

В США недавно вышла книга «Большие данные с человеческим лицом». В ней рассказано о том, какую реальную пользу людям приносят современные ЦОДы и высокопроизводительные серверы. И какой объем данных сегодня связан с самыми простыми событиями. Один новорожденный сегодня – со всеми фотографиями, видео, записями в социальных сетях – генерит объем информации во много раз превосходящий объем библиотеки конгресса США. И мы пока только в самом начале движения к большим данным.

Мы не задумываемся о том, какое количество данных производим сегодня. Вот цитата председателя совета директоров компании Google Эрика Шмидта: «Пять экзабайт информации создано человечеством с момента зарождения цивилизации до 2003 года. Столько же информации сегодня создается каждые два дня, и эта скорость постоянно увеличивается».

Все это говорит о том, что мир сделал огромный шаг от индустриальной цивилизации к цивилизации информационной. В ближайшие годы информация будет править миром и надо научиться работать с этим. Те компании и страны, которые осознают это сегодня завтра будут править миром.

Чтобы осознать, где мы находимся сегодня, давайте отступим на пять-десять-двадцать лет назад. Сначала был компьютер, и мы с ним работали. Потом появилась сеть Интернет, и все мы стали подключенными людьми. Сегодня просто сложно представить себе, как можно жить без подключения к Интернету. В соответствии с этим корпорация Intel кардинально поменяла подход к своим продуктам. Во главу угла поставлен пользователь и его интересы, его потребности. Вокруг этого и создаются наши продукты и сервисы Intel.

Цикл нарастания контента, который требует все более мощных устройств, а они в свою очередь создают все более богатый контент, требующий еще более мощных устройств, непрерывен. Все пользователи чувствуют, как растут возможности их устройств, но в соответствии с этим растут и их потребности. И параллельно с этим нарастают и объемы данных. Не так давно мы мыслили категориями мегабайт, их всем хватало. Но все чаще в разговорах об объемах данных появляются новые названия «зетабайт» и «йотабайт». Кстати, йотабайт – это 10 в двадцать четвертой степени байтов.

С наступающей реальностью бороться бесполезно. Всем нужны новые возможности. Поэтому рост интереса к ЦОДам и «большим данным» понятен. Кроме того, что ЦОДы снижают издержки пользователей, они предоставляют им новые возможности и новые сервисы. Это первый аспект их популярности, второй связан с тем, что стремительно падают стоимости процессорной мощности и единиц хранения. За 10 лет стоимость хранения упала раз в десять, а производительности процессоров раза в 3-4. Один из аспектов этого удешевления состоит в том, что сервера скоро могут проникнуть в наши дома и стать потребительским продуктом. Третий аспект – это появление новых видов данных. Все больше появляется неструктурированных данных. Например, картинка с камеры наблюдения может накапливаться где-то и храниться. Чтобы сделать эти данные полезными, надо предпринять определенные усилия. Пока из накапливаемых данных трудно извлечь пользу. Как это сделать?

Итак, данные где-то копятся, их надо хранить, обрабатывать и уметь извлекать из них пользу. Это первая проблема. Вторая – обеспечение безопасности этих данных.

Объемы накопления данных расширяются с каждым днем, постоянно появляются все новые и новые каналы накопления этих данных. Кроме хорошо известных всем печатных изданий, Интернета, радио и телевидения, появляется огромное количество сенсоров, которые могут предоставить океан необходимой информации. Все эти данные собираются и где-то накапливаются, а после этого их можно анализировать и что-то моделировать с их помощью. А вот уже анализ и моделирование требует серьезных вычислительных мощностей. Для этого необходимы новые мощные сервера и специальное ПО. Только с их помощью можно выявить какие-то тенденции, анализируя «большие данные». Пока это мало кто делает, а кто начнет делать, опередит конкурентов.

Пример. В Intel есть очень много данных, связанных с потребителями. Это результаты опросов, а теперь появилось огромное количество данных из социальных медиа. Все это как-то обсуждается, но конкретной информации о пользователях нет. Она находится на серверах социальных сетей. Сейчас у Intel есть план проанализировать все данные о пользователях. Можно попытаться проанализировать их предпочтения и пожелания и сделать какие-то выводы. Вот реальная работа с «большими данными».

Рассмотрим, что же можно сделать с помощью «больших данных». Анализом транспортного потока сегодня занимаются многие. В одной из азиатских столиц обратили внимание на то, что при начале дождя, количество вызовов такси в этом регионе возрастает. Компания, занимающаяся услугами такси, стала тщательно анализировать перспективы осадков в районах города и направлять туда свои такси заранее.

Очень важен тщательный анализ предпочтений и расположения потребителей при предоставлении им рекламы. Чтобы реклама была эффективной, надо четко знать, что, когда и кому рекламировать, а для этого надо проанализировать весь массив информации о потребителях.

Медицина – это уже сейчас «большие данные». Борьба с болезнями сегодня часто ведется не с помощью пробирок и шприцев, а с помощью анализа всей возможной информации на серверах.

И не только в медицине, но и в автомобилестроении. Самая последняя модель автомобиля RangeRover была создана без единого натурного теста, с помощью только компьютерного анализа. Ни одна машина не пострадала в результате их проведения. Весь дизайн, все тесты надежности и безопасности были проведены виртуально. Современный автомобиль – это очень сложное устройство, можно представить, сколько всего пришлось просчитать и пересчитать. И этот пример становится все более популярным у автомобилестроителей всего мира.

Итак, мы видим, что сегодня «большие данные» уже накапливаются и начинают использоваться. Например, в процессе полета самолета из Европы в США и обратно накапливается полтерабайта информации – это связь с землей, показатели черных ящиков, показания самых разных сенсоров и датчиков. Они передаются, но никогда не обрабатываются и не анализируются. Может, стоит подумать о том, как их анализировать? Или сократить объем? Еще одно направление работы с большими данными – думать над ними.

Еще один пример работы с большими данными. Пробки есть везде, в том числе и Риме. Римский муниципалитет задумался – почему они возникают? Оказалось, что в центре города тысячи машин ездят кругами в поисках места для парковки. Если поставить датчики в местах парковки и информировать всех желающих об этом, то пробки в центре можно существенно уменьшить.

Еще пример из Лондона. На вопрос о самой большой проблеме администрации города, ее представители достаточно неожиданно ответили – вода. Из озер, которыми питается город, до пользователей доходит только 60% воды. Почему – никто не знает. Думают о том, как встроить в систему водоснабжения города большое количество сенсоров и анализировать их показания.

Что делает Intel? Intel делает самые разные сенсоры. Недавно был объявлен новый процессор Quark с экстремально низким энергопотреблением (меньше одного ватта) как раз для работы в сенсорах любого типа. Он может также прекрасно работать в сенсорах, которые в недалеком будущем мы все будем носить на себе. Второе направление работы – это сервера. Третье – это программное обеспечение. Intel приобрел компанию, которая предлагает решения для обработки «больших данных».

Итак – большие данные предоставляют большие возможности для пользователей, но и для Intel, чтобы удовлетворить потребности пользователей.