Databricks

Материал из Циклопедии
Перейти к навигации Перейти к поиску

Databricks


Файл:13-02 Databricks схема.webp
Схема работы платформы Databricks: бизнес-аналитика, хранилище данных, ИИ и Data Science, ETL и аналитика в реальном времени, оркестрация







Ключевые фигуры
Али Годси, генеральный директор








Число сотрудников
8 тыс. (2025)




Databricks — американская компания, одна из крупнейших в ИТ-индустрии США. Специализируется на разработках в сфере облачных технологий, обработки и хранения данных, аналитики и искусственного интеллекта (ИИ). Штаб-квартира находится в Сан-Франциско. В числе деловых партнёров такие крупные компании как Amazon, Microsoft, Google. В числе основных конкурентов — OpenAI, разработчик ChatGPT, и Snowflake, создатель облака данных AI Data Cloud.

В 2024 году заняла вторую строчку в рейтинге облачных компаний Cloud 100 по версии американского журнала Forbes[1].

История[править]

У истоков компании, основанной в 2013 году, стояли Али Годси, Энди Конвински, Арсалан Таваколи-Шираджи, Ион Стойка, Матей Захария, Патрик Уэнделл и Рейнольд Син. Ранее они участвовали в проекте Apache Spark, который реализовывался на базе Калифорнийского университета в Беркли. Перед командой стояла задача создать распределенную среду с открытым исходным кодом для кластерных вычислений и обработки больших массивов информации. Databricks появилась для развития и масштабирования Apache Spark. В сентябре того же года команда получила 13,9 млн долларов инвестиций от венчурной компании Andreessen Horowitz[2].

В ноябре 2017 года компания была анонсирована как первый сервис на Microsoft Azure посредством интеграции Azure Databricks[3].

В июне 2020 года Databricks купила Redash, инструмент с открытым исходным кодом для визуализации данных и создания интерактивных панелей мониторинга[4].

В феврале 2021 года совместно с Google Cloud компания Databricks обеспечила интеграцию с Google Kubernetes Engine и платформой BigQuery от Google. В том же году купила немецкую компанию 8080 Labs, чей продукт bamboolib позволял исследовать данные без какого-либо кодирования. Тогда же компания привлекла 1,9 млрд долларов финансирования: 1 млрд долларов инвестировал Франклин Темплтон, остальную часть суммы — Amazon Web Services, CapitalG (компания по инвестированию в рост в составе Alphabet Inc.) и Salesforce Ventures. В августе того же года Databricks провела очередной инвестиционный раунд, собрав в общей сложности 1,6 млрд долларов. Капитализация компании на тот момент достигла 38 млрд долларов[5].

В марте 2023 года компания представила DBRX — модель ИИ с открытым исходным кодом, чтобы сторонние разработчики и исследовали могли свободно пользоваться технологией. Как утверждают в Databricks, модель DBRX по итогам тестов превзошла аналогичные разработки с открытым кодом и почти не отстаёт по ряду показателей от GPT-4. В том же году Databricks приобрела ряд ИТ-компаний — Okera (безопасность данных), MosaicML (генеративный ИИ), Arcion (репликации данных), Tabular (ИИ-система управления данными). Общая стоимость приобретений превысила 2,5 млрд долларов[6].

22 января 2025 года Databricks сообщила, что Meta (запрещена в России) и JPMorgan Chase проинвестируют проекты компании[7].

Деятельность[править]

Отделения и офисы компании находятся в Бразилии, США, Канаде, Коста-Рике, Великобритании, Германии, Дании, Израиле, Испании, Нидерландах, Саудовской Аравии, Сербии, Хорватии, Швеции, Швейцарии, Франции, Австралии, Индии, Китае, Сингапуре, Южной Корее и Японии[8].

По итогам 2023 года компания показала выручку в размере 1,6 млрд долларов, что на 50 % превышает аналогичные показатели 2022 года[9].

По оценкам на конец 2024 года, Databricks привлекла 10 млрд долларов в виде инвестиций и кредитов, капитализация компании достигла 62 млрд долларов[10].

По данным на январь 2025 года, в компании работали 8 тыс. человек[7].

Продукты[править]

Пользователям платформы доступны[5]:

  • опция Delta Sharing для обмена данными в режиме реального времени между разными платформами, облаками и регионами;
  • каталог Unity с функцией ИИ, позволяющий управлять структурированными и неструктурированными данными в любом облаке или на платформе;
  • унифицированные инструменты Mosaic AI для создания, развертывания и мониторинга решений в области ИИ, языковых моделей и машинного обучения;
  • открытая языковая модель общего назначения DBRX, на базе которой сторонние разработчики могут строить собственные модели;
  • Databricks Marketplace — открытый маркетплейс технологической и научной информации;
  • поддержка интегрированных сред разработки;
  • функция Partner Connect для поиска и интеграции данных от компаний-партнёров;
  • инструменты для преобразования разных типов данных, проверки их качества, обработки и визуализации;
  • проекты Apache Spark, Delta Lake, MLflow, Redash, Delta Sharing.

Руководство[править]

Databricks возглавляет Али Годси, один из соучредителей, занявший в 2016 году пост генерального директора компании. Личное состояние топ-менеджера, по оценке Forbes на 12 февраля 2025 года, достигало 2,7 млрд долларов[11].

Примечания[править]

  1. Kenrick Cai, Alex Konrad Forbes Cloud 100 2024 List - Best Cloud Computing Companies Ranked англ.. Forbes (06.08.2024). Проверено 12 февраля 2025.
  2. Елена Лиханова Databricks — альтернативная технология хранения большого количества данных. RB.ru (19.04.2022).
  3. Frederic Lardinois Microsoft makes Databricks a first-party service on Azure англ.. TechCrunch.com (15.11.2017).
  4. Frederic Lardinois Databricks acquires Redash, a visualizations service for data scientists англ.. TechCrunch.com (24.06.2020).
  5. 5,0 5,1 Мария Решетникова История компании Databricks: кто и зачем делает свободный аналог ChatGPT. РБК Тренды (03.04.2024).
  6. Иван Звягин Databricks создала самую мощную открытую модель ИИ — DBRX. РБК Тренды (28.03.2024).
  7. 7,0 7,1 Jordan Novet Meta backs Databricks as the data analytics startup inches toward IPO англ.. CNBC.com (22.01.2025).
  8. Worldwide locations. Databricks.
  9. Belle Lin AI is Driving Record Sales at Multibillion-Dollar Databricks. An IPO Can Wait … англ.. 06.03.2024 (The Wall Street Journal).
  10. Krystal Hu, Kenrick Cai, Echo Wang Exclusive: Databricks nears record $9.5 billion VC raise, eyes extra $4.5 billion debt англ.. Reuters (13.12.2024).
  11. Ali Ghodsi англ.. Forbes.

Шаблон:Компании-разработчики ИИ Шаблон:Компании-лидеры по внедрению ИИ

Рувики

Одним из источников, использованных при создании данной статьи, является статья из википроекта «Рувики» («ruwiki.ru») под названием «Databricks», расположенная по адресу:

Материал указанной статьи полностью или частично использован в Циклопедии по лицензии CC-BY-SA 4.0 и более поздних версий.

Всем участникам Рувики предлагается прочитать материал «Почему Циклопедия?».