Los datos son el nuevo petróleo. Y el aprendizaje automático es el fuego. Quien controle estos dos controlará el mundo.

No, lo anterior no es una frase pomposa sacada de una novela distópica.

Es una realidad.

El nuevo orden mundial consiste en recopilar grandes cantidades de datos relevantes y procesarlos para convertirlos en información procesable, algo que la raza humana no ha sido capaz de hacer en toda la historia. Es el tipo de tecnología que permite a un país adelantarse a los demás y, con el tiempo, dominar el mundo.

Como resultado, está siendo tomada muy, muy en serio por las naciones progresistas del mundo.

Una elección de carrera lucrativa

Dejando a un lado la intriga internacional, la ciencia de los datos y el aprendizaje automático es un campo nuevo y candente con una oportunidad increíble. La demanda está por las nubes (por decirlo suavemente) y no hay suficientes científicos de datos. Ni siquiera mediocres.

Es como si de repente hubiéramos descubierto muchos planetas nuevos habitables y no hubiera suficientes personas a las que trasladarlos. Podría seguir y seguir y parecer un disco rayado, pero creo que esta infografía hace el trabajo mucho mejor:

Así vemos que los salarios empiezan en 50.000 dólares , y en el caso de los directivos, pueden dispararse mucho más allá de los 250.000 dólares.

Y no sólo eso, la persona media de este planeta generará 1,7 MB de datos por segundo. Eso supone 3.500 TB de datos a lo largo de toda su vida, más datos de los que sabemos manejar hasta ahora, por no hablar de utilizarlos para el análisis.

¿Son difíciles la ciencia de datos y el aprendizaje automático?

Buena pregunta

Desde mi experiencia, la respuesta es tanto «sí» como «no»

La inteligenciaartificial (y, por extensión, el aprendizaje automático), es lo más difícil si uno se inclina por la investigación y va más allá de los límites. Para este tipo de trabajo, ni siquiera un doctorado en informática y matemáticas es suficiente. Pero entonces, la persona media no tiene ni la ambición ni el tiempo para semejante empeño.

En el otro extremo está lo que yo llamaría Ciencia de Datos Aplicada y Aprendizaje Automático.

Es decir, usted toma las herramientas, técnicas y algoritmos existentes y los aplica para resolver algunos problemas del mundo real. Esta parte requiere dedicación, percepción y pensamiento creativo (y el conocimiento de algunos conceptos matemáticos sencillos, que se aprenden rápidamente), pero en lo que respecta a los verdaderos conocimientos «técnicos», es mucho más indulgente que lo que exige el trabajo de un ingeniero de software.

En otras palabras, no es pan comido, pero atendiendo a la relación recompensa/esfuerzo, es una de las mejores inversiones que existen.

Ahora que ha endurecido su resolución de convertirse en un científico de datos e ingeniero de aprendizaje automático, empecemos a explorar las mejores opciones que hay.

Aprendizaje automático (Google)

No mucha gente lo sabe, pero Google tiene un curso extenso, muy práctico y gratuito sobre aprendizaje automático. Según la empresa, forma parte de su compromiso por hacer avanzar las tecnologías de IA/ML y mantener los conocimientos al descubierto.

Lo mejor de este curso es que no hay requisitos previos, pero prepárese para pasar más tiempo explorando los conceptos estadísticos por su cuenta.

Es decir, no es necesario, pero si no tiene conocimientos de estadística avanzada, las explicaciones de este curso pueden no ser suficientes. Otra pega es que este curso introduce el aprendizaje automático a través de TensorFlow, que es una implementación de ML desarrollada por Google. Así que, en cierto modo, Google pretende promocionar sus API para el Aprendizaje Automático, pero teniendo en cuenta el valor que ofrece este curso, no veo cómo eso debería ser un obstáculo.

En todo caso, TensorFlow es una de las formas más fáciles de introducirse en el ML y goza de una popularidad rabiosa (para una comparación de los marcos de IA, consulte esto).

Ciencia de datos

El nombre de Harvard inspira asombro, y este curso también.

Lo primero es lo primero: no es un curso de «vamos a ensuciarnos rápido» en el que se pasa de puntillas por el aprendizaje automático escribiendo un fragmento aquí o un script aquí. Este curso es un severo bautismo de fuego que exige trabajo duro y una importante inversión de tiempo.

El curso viene con vídeos gratuitos, código (alojado en GitHub) y soluciones a los ejercicios de laboratorio, por lo que, en la práctica, no se verá limitado por nada si desea realizarlo.

¿Público ideal?

Usted… no estoy bromeando.

Yo diría que profesionales en activo con una educación matemática decente, aunque puede que ya no se dediquen a las matemáticas (los hábitos de inferencia y demostración son lo más necesario). Pero una vez más, le advierto: puede que piense que es bueno, pero este curso le sentará como desayunar uñas endurecidas — los problemas de práctica son lo suficientemente desafiantes como para hacerle llorar, pero entonces, ¡eso podría ser exactamente lo que está buscando!

Aprendizaje automático

Entre en un bar lleno de científicos de datos y pregunte quién es Andrew Ng, y recibirá la paliza de su vida.

En los círculos de la ciencia de datos y el aprendizaje automático, Andrew Ng ha alcanzado un estatus de dios, gracias a su excepcional curso en Coursera — Aprendizaje Automático.

Y si duda de las credenciales de Andrew Ng, dejaré que esto hable por sí mismo:

Es un curso de pago, en el sentido de que forma parte del plan de precios de Coursera, pero el compromiso financiero y la determinación no son los únicos requisitos previos. Se trata de un curso largo, ya que Andrew se sumerge a fondo en las matemáticas que hay detrás de todo lo relacionado con el ML y disecciona algoritmos populares. Pero, afortunadamente, es un curso completo, y le guiará paso a paso hacia las profundidades más oscuras y le traerá de vuelta.

Lo recomiendo encarecidamente, ¡sobre todo porque alardear del certificado de finalización de este curso se ha convertido en una cosa de hoy en día!

Ciencia de datos aplicada

Las especializaciones en Coursera consisten en una serie de cursos que pretenden llevarle de cero a dominar un concepto concreto. Si está buscando un curso completo, serio pero amigable sobre Ciencia de Datos y Aprendizaje Automático con Python, no puedo recomendarle lo suficiente esta especialización.

Al final del curso, obtendrá un certificado.

DataCamp

DataCamp ofrece un montón de cursos de ciencia de datos, que también incluyen varias habilidades y trayectorias profesionales. Desde la manipulación de datos hasta el aprendizaje automático, adquirirá habilidades de científico de datos en Python y R que le ayudarán a tener éxito en el campo de la ciencia de datos.

Con el contenido del tamaño de un byte de DataCamp, podrá aprender a su propio ritmo. Estos cursos le proporcionan una experiencia práctica a través de la cual avanzará en sus habilidades de ciencia de datos.

datacamp learning - geekflare

Puede empezar con la versión gratuita y evaluar el curso viendo el primer capítulo.

edX

Aprenda de MITx, Harvardx, IBM, RICEx, UCSanDiegox y GTx en la plataforma edX.

Todos ellos cuentan con un completo plan de estudios que le ayudará a poseer habilidades de científico de datos. Estos programas son los más adecuados para quienes tienen formación en estadística o informática.

Si no está buscando un programa, puede elegir uno a la carta. En edX, encontrará más de 200 cursos relacionados con la ciencia de datos, que abarcan Python, R, Excel, probabilidad, estadística, aprendizaje automático, visualización de datos y muchos más.

Codecademy

Codecademy es otra plataforma que es uno de los mejores sistemas por ahí que le ayuda a aprender a codificar. Ellos creen en «Aprender haciendo» y tienen un montón de proyectos de práctica y pruebas en su plataforma.

El curso de ciencia de datos que ofrece Codecademy incluye SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn y muchas más bibliotecas.

codecademy advantage

Toda la carrera contiene 26 cursos que son más que suficientes para ayudarle a convertirse en un científico de datos de éxito.

Este curso de datos

  • Le proporciona un conocimiento profundo de la ciencia de datos
  • Proporciona una hoja de ruta fácil de seguir
  • Le prepara para el empleo ayudándole a adquirir suficiente experiencia práctica

Udemy

Udemy no necesita presentación.

Python for Data Science and Machine Learning Bootcamp en Udemy es uno de los cursos más populares con más de 85K calificación de 4,6 y ha sido tomado por 370K estudiantes en todo el mundo.

udemy data science

A continuación se presentan los temas tratados en este curso:

udemy data science course

A continuación se presentan las características / entregables de este curso:

  • 25 horas de vídeos a la carta
  • Acceso completo de por vida
  • 13 artículos y cinco recursos descargables
  • Acceso en móvil y TV
  • Certificado de finalización
  • garantía de devolución del dinero en 30 días

Por lo tanto, si prefiere un curso económico, éste sería el más adecuado para empezar.

Google AI

¿Le interesaría aprender aprendizaje automático de los expertos en ML de Google?

Entonces tiene que consultar los cursos de Google AI.

Esta plataforma tiene cursos y contenidos de aprendizaje automático y ciencia de datos para estudiantes, ingenieros de software, científicos de datos e incluso investigadores. Estos cursos son gratuitos.

Para empezar, Machine Learning Crash Course en Google AI debería ser su curso de referencia. Se trata de un curso rápido con una introducción práctica utilizando las API de TensorFlow. A continuación encontrará los detalles de este curso:

machine learning google ai

Esta plataforma también cuenta con cursos específicos sobre temas importantes del aprendizaje automático como la agrupación, los sistemas de recomendación, las pruebas y la depuración en el aprendizaje automático, la separación de datos y la ingeniería de características en el aprendizaje automático. Si ya conoce los fundamentos del aprendizaje automático, estos cursos le aportarán un valor añadido.

Udacity

Udacity es también una plataforma de aprendizaje electrónico muy popular que cuenta con una plétora de cursos sobre tecnologías de tendencia. Cuenta con varios programas líderes en la industria creados y reconocidos por las principales empresas de todo el mundo, como AT&T, AWS, Google, IBM.

Uno de los programas de Udacity es el de Ciencia de Datos – Escuela de Ciencia de Datos. Este programa le ayuda a embolsarse trabajos de analista de datos, científico de datos, ingeniero de datos y analista de negocios. El curso de Científico de Datos en este programa es el crucial que cubre conceptos sobre aprendizaje automático, aprendizaje profundo e ingeniería de software. Es necesario tener conocimientos básicos de aprendizaje automático para optar a este curso.

data science udacity

En caso de que sepa programar en python pero sea nuevo en el aprendizaje automático, hay otro programa en Udacity: School of AI. Este programa tiene cursos que empiezan por los fundamentos del aprendizaje automático.

machine learning udacity

Aprendizaje profundo

Este curso es una bendición y es mi recomendación favorita en esta lista si usted es un codificador.

Diría eso de nuevo: si usted es un codificador.

Eso es porque este curso no dedica tiempo a enseñarle los fundamentos de la programación. La descripción del curso lo dice en términos muy claros (los subrayados son originales):

Asumimos que todos los que tomen este curso tienen al menos un año de experiencia en codificación. El curso utiliza python como lenguaje de enseñanza, por lo que si aún no sabe python, asumimos que dedicará el tiempo necesario para aprender-para un codificador experimentado debería encontrar que python es un lenguaje bastante fácil de aprender.

Así que si ya sabe Python (si no lo aprende aquí), o puede sentirse cómodo rápidamente, este es el curso perfecto para los pragmáticos que quieren construir sistemas reales y utilizables sin preocuparse demasiado por los fundamentos teóricos de los algoritmos.

Incluso podría decir que es para los juguetones impacientes (¡como yo!) que odian la ceremonia y la monotonía.

Y oh, ¿he mencionado que es 100% gratuito y que cuenta con una gran comunidad?

Conclusión

¡Uf!

Esta fue una lista difícil de compilar. No porque no hubiera suficientes fuentes buenas, ¡sino porque había demasiadas!

El aprendizaje automático es un dominio que literalmente ha explotado y está resolviendo problemas difíciles de forma realmente elegante, por lo que hay cientos de cursos en línea, gratuitos y de pago, la mayoría de ellos muy, muy buenos. Pero esto también puede ser una fuente de confusión, por lo que he intentado reducirlo a once para diferentes tipos de alumnos según su nivel de experiencia.

A continuación, conozca en detalle la ingeniería de funciones.