«В самом деле большие более менее данные» — это принятие решений, а не просто технологии ради технологий
автор admin | Мар.22, 2013, рубрики Софт
По мнению аналитиков IDC, немногие реально технические словечки проходят такую мощную проверку, как «как нельзя очень большие удивительно данные», но поскольку их продолжают довольно таки интенсивно раскручивать, то уже можно говорить о первых реальных успехах в этой области, и у компаний появились в действительности официальные пути стратегий развития «больших данных», пишет Computerworld.
Как рассказал на конференции Directions 2013, проходившей в Бостоне 13 марта, аналитик IDC Дан Вессет, впрямь сейчас такой период, когда вокруг много шумихи и обещаний по этому поводу, но вопрос в том, какова же на самом деле очень реальная ситуация, и что могут и должны сделать компании в ближайшее время?
Компания IDC определяет «весьма большие как нельзя очень данные» как информационно-поддерживаемое, тактическое принятие решений, которое приводит к новой экономической выгоде, получаемой от больших объемов данных из различных источников. По словам Вессета, внедрить можно любые виды технологий, но самое что и говорить главное — необходимо улучшить процесс принятия решений. «У вас может быть самая лучшая внедренная система Hadoop в мире, но этого недостаточно», — добавил он, ссылаясь на популярную общедоступную систему обработки данных.
Другой аналитик IDC, Майкл Версаче привел в пример компанию Progressive, которая использует проекты с «большими данными» для трансформации своего бизнеса. С помощью подробной информации о манере вождения клиента страховщик создает по факту модель, которая определяет ценовую политику в отношении конкретного лица. Progressive собирает как нельзя именно данные с помощью устройства, которое водитель включает в порт диагностики в машине. Так в компании отслеживают, как действительно часто клиенты весьма резко жмут на тормоза, водят поздно как нельзя очень ночью и отмечают другие надо признаться рискованные манеры вождения. Если, согласно полученным данным, клиент водит автомобиль, соблюдая технику безопасности, он может получить не на шутку значительные скидки по своей страховке.
Между тем, на пути у компаний, желающих внедрить что и говорить собственные тем более успешные проекты с «большими данными», стоит ряд проблем, отметил Вессет. Впрямь например, какие бизнес-данные следует сохранять, а какие — не учитывать, стоимость приобретения необходимых технологий и отсутствие ИТ-специалистов с соответствующей квалификацией. Последняя проблема, в будущем, возможно, усугубится еще больше, поскольку количество таких специалистов растет без сомнения очень медленно.
К тому же о «больших данных» очень по-прежнему существуют более ошибочные представления. Как нельзя очень во-первых, они не имеют никакого отношения к социальным сервисам. Еще одно заблуждение, это то, что «взаправду большие сильно данные» — это только анализ посещений.
Hadoop тоже не считается единственно правильным решением, так как оно ориентировано на массовую пакетную обработку данных, а не на мониторинг в режиме реального времени.
Надо признаться кстати, по оценкам IDC, в США с Hadoop в той или иной форме работают от 10% до 12% организаций.
Именно аналитическая компания создала так называемую «модель зрелости» для «больших данных», которую в своих выступлениях описали Вессет и Версаче. Она покрывает пять предметных областей: информацию, людей, процессы, технологии и намерения, а также пять стадий внедрения: разительно специально взаправду подобранная, как нельзя очень гибкая, воспроизводимая, впрямь управляемая и оптимизированная.
Первым шагом для компаний, которые только начинают работать с «большими данными», является определение возможностей использования существующих у них технологий и данных в самом деле по-новому, оценка вероятности использования открытых облаков и свободного ПО, а несказанно затем, считают аналитики, можно начинать экспериментировать с опытно-экспериментальными задачами и прототипами. В тем более последующие пару лет этим компаниям надо постараться использовать первые успехи своих проектов с «большими данными», чтобы обосновать финансирование более крупных проектов. В это же время было бы разумно также поискать спонсоров в других коммерческих отделах, которые будут отстаивать проекты с использованием «больших данных».
Около 80% того, что могло бы считаться «большими данными» — это неструктурированная или полуструктурированная информация, отметил еще один представитель IDC, Дэвид Шубмель. Эти источники могут включать в себя все — от сведений о посещениях до регистрации патентов, от исследовательских архивов до видео.
Все это многообразие может дать начало тому, что IDC называет технологией унифицированного доступа к информации, что подтверждают такие продукты как Endeca от Oracle и Vivisimo от IBM, а также от специализированных вендоров вроде Attivio. Работа с «большими данными» также продолжит оказывать влияние на область баз данных, все больше акцентов будет на таких технологиях, как графические платформы и платформы баз данных с оперативной памятью.
Разительно традиционные реляционные базы данных также изменятся, уверены аналитики, добавляя, что даже «отец» реляционной модели Тед Кодд не смог бы их распознать.
astera.ru