Понятие Big Data в 2008 году ввел редактор журнала «Nature» Клиффорд Линч. Он использовал этот термин в процессе описания активного роста мировых объемов информации.
При этом, большие данные начали существовать намного раньше, чем появился сам термин. Ведь, например, поисковые системы и социальные сети изначально строили свои сервисы на технологиях обработки Big Data.
Что такое BigData?
По утверждениях специалистов, большими данными можно называть любые потоки информации объемом более 100 Гб в сутки. Тем не менее, в последнее время термин Big Data стал очень популярный и используется многими для обозначения любых потоков данных, что в свою очередь размывает истинное понятие больших данных.
При этом, в связи с активным ростом объемов информации и отсутствием ее структурированности, большие данные становятся все более популярными, ведь для каждого предпринимателя очень важно эффективное использование данных, их структуризация и хранение.
Сфера больших данных имеет свои характерные признаки:
Volume – объем, накопленные данные имеют большой объем, который сложно обрабатывать стандартными сервисами и хранить на обычных ресурсах.
Velocity – скорость, данная особенность показывает не только скорость сбора данных, а и их обработку, в современном мире это особо важно, поскольку все больше становится востребованной обработка данных в режиме реального времени.
Variety – многообразие, то есть возможность обработки и анализа разных данных, как структурированных, так и структурированных. Учитывая то, что сейчас 80% информации является неструктурированной, то это очень большое преимущество.
Veracity – достоверность данных, учитывая то, что многие интернет компании сталкиваются с тем, что получают данные от ботов, а не от реальных людей, то для них этот показатель особо актуальный.
Value – ценность информации, все полученная информация должна приносить пользу компании, улучшать ее работу, оптимизировать расходы и усовершенствовать бизнес-процессы.
Объем данных с каждым годом стремительно увеличивается и чем больше становятся данные, тем более востребованными становятся услуги их обработки.
Согласно исследованиям американского агентства Wikibon, в 2020 году мировой рынок продуктов и услуг для работы с большими данными составит $360,91 млрд., а в 2026 году — до $85 млрд. Увеличения прибыли составляет примерно 17% каждый год.
