Científico de dados: así es y así se forma uno en esta profesión cada vez más demandada

Compartilhar no facebook
Compartilhar no google
Compartilhar no twitter
Compartilhar no linkedin
Clique aqui para visualizar a página da web original em www.xataka.com

Artículo seleccionado, original en www.xataka.com


Científico de dados: así es y así se forma uno en esta profesión cada vez más demandada

La sabiduría popular lo tiene claro, un científico de datos (un cientista de dados) es "un estadístico que trabaja en San Francisco". Sim que, desde hace unos años, esta profesión está de moda gracias, en parte, al mundo startupil. Pero la ciencia de datos va mucho más allá y está convirtiéndose en una de las profesiones más prometedoras de hoy en día.

La fiebre de los datos ha hecho que empecemos a escuchar hablar de esta disciplina por todos lados. Pero, não podemos dejar de preguntarnos si es una moda pasajera o los científicos de datos han venido para quedarse. Repasamos qué es exactamente eso de la ciência de dados, sus oportunidades laborales e las posibilidades que existen para formarse.

¿Qué es un científico de datos?

Otra forma de verlo es la de Josh Wills. Wills USA otra definição que me parece mucho más acertada e intuitiva: "Científico de dados (n): Persona que sabe más de estadística que cualquier programador y que a la vez sabe más de programación que cualquier estadístico". Un poco más en serio, un científico de datos es sencillamente un profesional a dedicado a analizar e interpretar grandes bases de dados. O lo que es lo mismo, uno de los profesionales más importantes en cualquier empresa de internet hoy en día.

¿Por qué se ha puesto de moda?

7155294657 4de9f80b13 O

La respuesta nos la daba Javi Pastor: la tecnología atual sem solo necesita del mejor talento sino de dados, mucho dados. Muchos. Es decir, que la moda por lo aberto y el giro hacia los datos não es más que la enésima máscara del mismo espíritu corporativo de siempre buscando el próximo yacimiento. Y lo que vale para los entornos de inteligencia artificial y de machine learning, vale para casi cualquier tecnología.

Lo curioso es que este gran valor de los dados contrasta con que precisamente los dados son el recurso más abundante del planeta. Se calcula que la cantidad de datos que había no mundo a principios de este 2020 era de aproximadamente 44 zettabytes. Es decir, que o número de bytes no universo digital era 40 veces mayor que o número de estrelas no universo observável. No parecen cosas fáciles de compatibilizar. ¿Cómo é possível que algo tan abundante sea tan valioso? Aunque fuera por pura oferta y demanda, acumular datos debería ser algo trivial. Sim, lo complejo es procesarlos.

Hasta hace relativamente poco sencillamente no podíamos hacerlo. A finales de los años 90, el campo del machine learning (aprendizaje automático) empezó a tomar entidad autónoma, nuestra capacidad de trabajar con cantities inmensas de datos se abarató y la irrupción social de internet hizo el resto. Desde hace unos años nos encontramos ante la primera gran 'democratización' de estas técnicas. Y, con ello, el boom de los científicos de datos: nadie quiere tener una mina de oro sin aprovechar.

Em busca de um científico de dados

6281323903 1c952cdcd6 O

O problema é que todo está, há conllevado que surgiera una gran demanda de um perfil que hasta hace no mucho prácticamente no existía. Recordemos que se precisan conocimientos estadísticos que un programador no suele tener y conocimientos informáticos que un estadístico no suele ni siquiera imaginar.

Reciclé mi vida profesional por completo haciendo cursos gratuitos de Coursera sobre data science

La mayor parte de las veces se ha solucionado con formación autodidacta que completa las habilidades básicas que debería tener programa formativo pero no tiene. Por eso, hoy por hoy, podemos encontrar uma gran diversidad de perfis profesionales no mundo de la ciencia de datos.

Si analizamos los datos del portal de empleo De fato, los científicos de datos provienen de los campos de estudio más diversos (los ingenieros de software estarían justo en el extremo opuesto). La mayoría, eso sí, tienen una formación eminentemente técnica, aunque hay un 5% de ellos que provienen de las ciencias sociales. Además, llama la atención que ya hay un 9% de científicos de datos que provienen de estudios específicos en la materia. Algo que sorprende puesto que, hasta hace no mucho, no había programas universitarios de ciencia de datos.

Según estos mismos números, los científicos de dados filho los profesionales que más estudos de doctorado suelen tener, aunque no sea algo necesario: uno de cada 5 científico de datos tiene una titulación de este rango.

Cómo formarse

6082519811 36ae7dcb83 O

A día de hoy, algunas unviersidades ofrecen ya grados de titulación para ser un científico de datos, como Grado de Ciencia de Datos Aplicada / Applied Data Science de la Universitat Oberta de Catalunya, Grado en Ciencia de Datos de la Politécnica de Valencia, Grado en Ciencia de Datos de la Universidad de Valencia o Grado en Ciencia de Datos de la Universidad Europea.

Existe algunos grados dobles en ingeniería informática y matemáticas (Autónoma de Madrid, Granada, Politécnica de Cataluña, Complutense, Murcia Autónoma de Barcelona) o en informática y estadística (Universidad de Valladolid).

El de los posgrados es un mundo muy diverso. Podemos encontrar posgrados, másteres de cursos de especialización em casi todas as universidades e uma oferta privada realmente desmesurada. Por poner algunos ejemplos tenemos posgrados en la UAB, la UPM o la Pompeu Fabra. De todas as formas, en posgrados es más difícil de recomendar um curso en concreto. La clave está en buscar nuestra formación complementar anterior, en ese sentido, la diversidad es una buena noticia.

Cabe recordar, además, que en la formación de posgrado se prima mucho el componente de 'orientación de negocio'que a veces escasea en las titulaciones universitarias. No debemos olvidar que o prefeito parte do trabalho de los científicos de dados está nas empresas que buscan rentabilizar sus bases de dados, porque lo que la orientación al mercado es algo muy recomendable. De hecho, muchos de los másteres en 'big data' lo ofrecen escuelas de negocios como OEI o Instituto Empresa.

Analisar o científico de dados e o mandado de SEO na redação

Uno de los recursos más interesantes que podréis encontrar filho Los Moocs (ya sabéis, los cursos abiertos masivos online). De hecho hace poco, vimos que esta opción autoformativa podía tener mucho futuro. Empezando por o programa de especialização em big data de Coursera, podemos encontrar cursos online de las mejores universidades do mundo. Todo esto sin hablar de las numerosas herramientas para aprender lenguajes como Python o R.

También existen una serie de certificados o certificados que permiten avalar nuestros conocimientos en ciencia de datos: el Certified Analytics Professional (BONÉ), Profissional certificado pela Cloudera: cientista de dados (CCP: DS), el Open Certified Data Scientist (CDS aberto) o los que ofrecen algunas empresas, como EMC: Data Science Associate (EMCDSA), los de SAS, el de Google Engenheiro de dados profissional certificado, el IBM Data Science Professional Certificate (disponible en Coursera) o el de Microsoft Associado Cientista de Dados Certificado Azure. Algunos de estos certificados tienen unos requisitos muy duros pessoa filho una buena alternativa si hemos estado trabalhando neste campo con anterioridad.

Otros recursos interesantes son las asociaciones (como R Hispano o Python España) y los grupos informativos tipo Databeers que tanto éxito están teniendo por todo el país. Además, basta buscar en MeetUp para darse cuenta de la diversidad de eventos y reuniones en data science que hay creados.

¿Qué lenguajes hay que aprender?

8553577728 A2ef963df9 B

En realidad, como cualquier iniciado sabe, en programación la elección de un lenguaje u otro siempre es complicada. En esta elección intervienen desde fatores técnicos o formativos a simples preferencias personales.Lo que sí está claro es que hay algunos lenguajes mais populares que outros e que também está mudando com o tempo e según avanza esta cidade de dados.

Los tres mosqueteros de la Ciencia de Datos

Un estudio de Kaggle de 2018 revelou que Python, SQL e R son os lenguajes de programação mais populares. El de más aceitação, con diferenciação, fue Python (el 83% de los encuestados lo usaban). Además, 3 de cada 4 profesionales de datos recomendaron que los aspirantes a científicos de datos aprendan Python primero.

1 Crymltlfzrekcvyyre6q1w

Insustentável

  • SQL: El 44% de los científicos de dados usan SQL y si incluyéramos a todas as bases de datos, completaríamos casi el 100 por 100 de los encuestados. Es algo necesario no sólo por la inmensa cantidad de datos de los que hablamos sino porque la mayor parte de los datos que usa um cientista de datos profesional provienen de internet.

La gran división

  • R: Em torno de um 36% de los dateros usan R para seu trabalho usual. Tenha um favor que foi o lenguaje estadístico para excelencia durante muitos anos e podemos encontrar códigos e paquetes para casi cualquier cosa que se nos ocurra. Tiene en su contra que sua sintaxe é mais antigua, compleja y fea que otros lenguajes más modernos que empujan fuertes. Es el lenguaje de los que se acercan from un fundo científico.
  • Pitão: El 83% por ciento de los dateros usan Python de forma habitual. Es la némesis de R en este caso: tiene una sintaxis muy buena y moderna pero aún queda mucho por trabajo por hacer desarrollando su ecosistema. Não obstante, para ser justo, Python cada vez es más competitivas e iniciativas como SciPy están poniéndole las cosas muy difíciles a R. Es el lenguaje de los que se acercan from un background informático.

Aunque el sentido común nos dice que cada um de los lenguajes es mejor para determinadas cosas, en la práctica hay cierta rivalidad. Pessoalmente, uso R pero suelo recomendar Python. Não sólo porque es más bonito, sino porque es multipropósito y eso siempre es una ventaja.

  • Julia: Julia es la esperanza blanca de la ciencia de datos (aunque conforme pasan los años, parece que ha perdido su gran oportunidad). Un lenguaje diseñado para conservar la potencia de lenguajes como fortran ou C combinado con las facilidad de sintaxis de los nuevos lenguajes. Si tuviera que apostar, a día de hoy, no lo haría por Julia. Le queda mucho trabajo si quiere ser algo mais que o refugio de los fortraneros más abertos.
Cz 6tpbwkauv4r7

Incombustível

  • Excel: No es un lenguaje y no suele gustar a aquellos que trabajan con datos a nivel profesional. O eso dicen cuando se les pregunta porque las encuestas dicen lo contrario: Un 59% por ciento de los encuestados usan habitualmente excel. Así que, en fin, la aplicación de hojas de cálculo de Office sigue dando mucha guerra.

El hermano corporativo y otros lenguajes y programas

  • Algunos lenguajes o entornos gozan de cierto éxito empujados por la inercia corporativa: es el caso del clásico Matlab pero ha ido oscilando su uso y ahora está no 14%.

  • Si examamos las encuestas podemos encontrar muchos más lenguajes que obedecen a necesidades más particulares de la práctica de los científicos de datos (o de los programas que usan): Scala (17%), Folga (10%), Perl (12%), C# (6%), Mahout (3%), Apache Hadoop (13%) ou Java (23%).

  • También, aunque es posible que debiéramos hablar de ellos por separado, hay muchos programas específicos (libres o privativos) que se usa na ciência de dados com distintos usos. Por poner algún ejemplo, podríamos hablar de Quadro, RapidMiner tributo Weka.

El mercado laboral: sueldos y oportunidades

7408506410 Fbd7bc0fcd K

Los sueldos, como en general en el mundo del desarrollo de software, cambian mucho dependiendo del lugar, las funciones e o empleador. Según Glassdor, el sueldo base para um Cientista de Dados na Espanha se sitúa, de media, nos 35.394 euros al ano. Una cifra semelhante a la que también ofrece Escala de pagamento, que lo sitúa en so 35.925 euros.

Nos Estados Unidos, a cifra é muito mais abultada: 124.251 dólares al año, según De fato.

No obstante, estos sueldos medios hay que tomarlas con mucha prudencia. Mientras el salario medio en Estados Unidos es de 50.965 euros al año (4.247 euros al mes), el salario medio español se sitúa en 1.658 euros brutos mensuales, según Adecco Institute.

Faça que o mercado haya ido madurando y, por tanto, los salarios también se hayan ido reajustando a la oferta y la demanda. Pero también parece que no futuro se seguirán necesitando científicos de dados que sean capaces de extraer el valor de toda la información que estamos generando.

Vamos começar uma conversa

Este site usa cookies para garantir que você obtenha a melhor experiência em nosso site.