Databricks

Origem: Wikipédia, a enciclopédia livre.
Databricks
upright=!Artigos sem imagens
História
Fundação
Quadro profissional
Tipo
Estado legal
Domínio de atividade
Sede social
País
Organização
Empregados
4 000 ()
Fundadores
Ali Ghodsi (en)
Ion Stoica (en)
Reynold Xin (en)
Matei Zaharia (en)
Presidente
Ion Stoica (en) (a partir de )
Direção
Ali Ghodsi (en) (a partir de )
Afiliação
Receita líquida
1 000 000 000 $ ()
Website
Identificador
CIK
Logomarca

A Databricks é uma empresa americana de software fundada pelos criadores do Apache Spark.[1] A Databricks desenvolve uma plataforma baseada na web para trabalhar com o Spark, que fornece gerenciamento automatizado de cluster e notebooks no estilo IPython

História[editar | editar código-fonte]

A databricks surgiu do projeto AMPLab na Universidade da Califórnia, Berkeley, envolvido na criação do Apache Spark, uma estrutura de computação distribuída de código aberto construída sobre Scala. A empresa foi fundada por Ali Ghodsi, Andy Konwinski, Arsalan Tavakoli-Shiraji, Ion Stoica, Matei Zaharia,[2] Patrick Wendell e Reynold Xin.

Em novembro de 2017, a empresa foi anunciada como um serviço primário no Microsoft Azure por meio da integração Azure Databricks.[3]

A empresa desenvolve o Delta Lake, um projeto de código aberto destinado a trazer confiabilidade aos data lakes para aprendizado de máquina e outros usos em ciência de dados.[4]

Em junho de 2020, a Databricks adquiriu o Redash, uma ferramenta de código aberto projetada para ajudar cientistas e analistas de dados a visualizar e criar painéis interativos de seus dados.[5]

Em fevereiro de 2021, juntamente com o Google Cloud, a Databricks começou uma integração com o Google Kubernetes Engine e a plataforma BigQuery do Google.[6] A Fortune classificou o Databricks como um dos melhores grandes "Locais de Trabalho para Millennials" em 2021.[7] Na época, a empresa disse que mais de 5.000 organizações usavam seus produtos.[8]

Em agosto de 2021, a Databricks terminou sua oitava rodada de financiamento levantando US$ 1,6 bilhão, com uma avaliação da empresa em US$ 38 bilhões.[9]

Em outubro de 2021, a Databricks fez sua segunda aquisição da empresa alemã sem código 8080 Labs. 8080 Labs é a desenvolvedora de bamboolib, uma ferramenta de exploração de dados que não requer codificação para usar.[10]

Financiamento[editar | editar código-fonte]

Em setembro de 2013, a Databricks anunciou que levantou US$ 13,9 milhões da Andreessen Horowitz e disse que pretendia oferecer uma alternativa ao sistema MapReduce do Google.[11][12] A Microsoft foi um investidor notável da Databricks em 2019, participando da Série E da empresa por um valor não especificado.[13][14] A empresa levantou US$ 1,9 bilhão em financiamento, incluindo uma série G de US$ 1 bilhão liderada por Franklin Templeton em uma avaliação pós-money de US$ 28 bilhões em fevereiro de 2021. Outros investidores incluem Amazon Web Services, CapitalG (uma empresa de capital de crescimento sob Alphabet, Inc.) e Salesforce Ventures.[8]

Rodadas de financiamento
Series Encontro Valor (milhões de dólares) Investidores Líderes
UMA 2013 13,9[11] Andreessen Horowitz
B 2014 33[15] Novos Associados Empresariais
C 2016 60[16] Novos Associados Empresariais
D 2017 140[17] Andreessen Horowitz
E fevereiro de 2019 250[18] Andreessen Horowitz
F Outubro de 2019 400[19] Andreessen Horowitz
G Janeiro de 2021 1.000[20] Investimentos Franklin Templeton
H Agosto de 2021 1.600[21] Morgan Stanley

Produtos[editar | editar código-fonte]

A Databricks desenvolve e vende uma plataforma de dados em nuvem usando o termo de marketing "lakehouse", um portmanteau baseado nos termos "data warehouse" e "data lake".[22] O lakehouse do Databricks é baseado na estrutura Apache Spark de código aberto que permite consultas analíticas em dados semiestruturados sem um esquema de banco de dados tradicional.[23]

O Delta Engine da Databricks foi lançado em junho de 2020 como um novo mecanismo de consulta que se sobrepõe ao Delta Lake para aumentar o desempenho da consulta.[24] É compatível com Apache Spark e MLflow, que também são projetos de código aberto da Databricks.[25]

Em novembro de 2020, a Databricks introduziu o Databricks SQL (anteriormente conhecido como SQL Analytics) para executar relatórios de análise e inteligência de negócios em data lakes. Os analistas podem consultar conjuntos de dados diretamente com SQL padrão ou usar conectores de produto para integrar diretamente com ferramentas de inteligência de negócios como Tableau, Qlik, Looker e ThoughtSpot.[26]

A Databricks também oferece uma plataforma para outras cargas de trabalho, incluindo aprendizado de máquina, armazenamento e processamento de dados, análise de streaming e inteligência de negócios.[27]

A empresa também criou Delta Lake, MLflow e Koalas, projetos de código aberto que abrangem engenharia de dados, ciência de dados e aprendizado de máquina.[28] Além de construir a plataforma Databricks, a empresa co-organizou grandes cursos online abertos sobre o Spark[29] e uma conferência para a comunidade Spark chamada Data + AI Summit,[30] anteriormente conhecida como Spark Summit.

Operações[editar | editar código-fonte]

A Databricks está sediada em São Francisco.[31]

Referências[editar | editar código-fonte]

  1. Dwoskin, Elizabeth (9 de junho de 2016). «This is where the real action in artificial intelligence takes place». Washington Post. Consultado em 16 de agosto de 2016 
  2. Zaharia, Matei. «Matei Zaharia». Consultado em 16 de agosto de 2016 
  3. «Microsoft makes Databricks a first-party service on Azure». TechCrunch (em inglês). Consultado em 6 de abril de 2021 
  4. «Databricks launches Delta Lake, an open source data lake reliability project». VentureBeat (em inglês). 24 de abril de 2019. Consultado em 6 de abril de 2021 
  5. «Databricks acquires Redash, a visualizations service for data scientists». TechCrunch (em inglês). Consultado em 6 de abril de 2021 
  6. «Databricks brings its lakehouse to Google Cloud». TechCrunch (em inglês). Consultado em 18 de fevereiro de 2021 
  7. «100 Best Large Workplaces for Millennials». Fortune 
  8. a b Konrad, Alex (2 de fevereiro de 2021). «Databricks Raises $1 Billion At $28 Billion Valuation, With The Cloud's Elite All Buying In». Forbes (em inglês). Consultado em 29 de julho de 2021 
  9. Mellor, Chris (1 de setembro de 2021). «Databricks raises data lake of cash at monstrous $38bn valuation». Blocks & Files. Consultado em 4 de setembro de 2021 
  10. Eric Rosenbaum (6 de outubro de 2021). «$38 billion software start-up Databricks makes acquisition to leave code behind». CNBC. Consultado em 20 de fevereiro de 2022 
  11. a b Harris, Derrick (25 de setembro de 2013). «Databricks raises $14M from Andreessen Horowitz, wants to take on MapReduce with Spark». Consultado em 28 de setembro de 2014 
  12. Lorica, Ben (25 de setembro de 2013). «Databricks aims to build next-generation analytic tools for Big Data». O'Reilly Media. Consultado em 28 de setembro de 2014 
  13. «Databricks raises $250M at a $2.75B valuation for its analytics platform». TechCrunch (em inglês). Consultado em 8 de abril de 2021 
  14. Novet, Jordan (5 de fevereiro de 2019). «Microsoft used to scare start-ups but is now an 'outstandingly good partner,' says Silicon Valley investor Ben Horowitz». CNBC (em inglês). Consultado em 6 de abril de 2021 
  15. Miller, Ron (30 de junho de 2014). «Databricks Snags $33M In Series B And Debuts Cloud Platform For Processing Big Data». TechCrunch. Consultado em 28 de setembro de 2014 
  16. Shieber, Jonathan. «Databricks raises $60 million to be big data's next great leap forward». TechCrunch. Consultado em 16 de dezembro de 2016 
  17. «Databricks Secures $140 Million to Accelerate Analytics and Artificial Intelligence in the Enterprise». Databricks (em inglês). Consultado em 16 de maio de 2019 
  18. «Databricks' $250 Million Funding Supports Explosive Growth and Global Demand for Unified Analytics; Brings Valuation to $2.75 Billion». Databricks (em inglês). Consultado em 5 de fevereiro de 2019 
  19. «Databricks announces $400M round on $6.2B valuation as analytics platform continues to grow». TechCrunch (em inglês). Consultado em 24 de outubro de 2019 
  20. «Databricks raises $1B at $28B valuation as it reaches $425M ARR». Tech Crunch (em inglês). Consultado em 14 de fevereiro de 2021 
  21. «Databricks raises $1.6B at $38B valuation as it blasts past $600M ARR». Tech Crunch (em inglês). Consultado em 1 de julho de 2021 
  22. Michael, Armbrust; Ghodsi, Ali; Xin, Reynold; Zaharia, Matei (janeiro de 2021). «Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics» (PDF). Conference on Innovative Data Systems Research. Consultado em 29 de julho de 2021 
  23. «With massive $1B infusion, Databricks takes aim at IPO and rival Snowflake». SiliconANGLE (em inglês). 1 de fevereiro de 2021. Consultado em 8 de abril de 2021 
  24. «Databricks Cranks Delta Lake Performance, Nabs Redash for SQL Viz». Datanami. 24 de junho de 2020. Consultado em 8 de abril de 2021 
  25. «Databricks launches Delta Lake, an open source data lake reliability project». VentureBeat (em inglês). 24 de abril de 2019. Consultado em 8 de abril de 2021 
  26. «Databricks launches SQL Analytics». TechCrunch (em inglês). Consultado em 8 de abril de 2021 
  27. Brust, Andrew. «Databricks, champion of data "lakehouse" model, closes $1B series G funding round». ZDNet (em inglês). Consultado em 8 de abril de 2021 
  28. «The Two Sigma Ventures Open Source Index». Two Sigma Ventures (em inglês). Consultado em 8 de abril de 2021 
  29. «Databricks to run two massive online courses on Apache Spark». Databricks (em inglês). 2 de dezembro de 2014. Consultado em 16 de dezembro de 2016 
  30. «Data + AI Summit». Databricks (em inglês). Consultado em 8 de abril de 2021 
  31. staff, CNBC com (16 de junho de 2020). «36. Databricks». CNBC (em inglês). Consultado em 8 de abril de 2021