Por aquel entonces, en la década de 2010, los diseñadores y programadores web tenían títulos de trabajo extravagantes y cobraban unos salarios bastante buenos. Pero con los tiempos de Internet, las cosas han cambiado.

En esta era moderna delsiglo XXI, se registra su historial de navegación, se almacenan los datos de su correo electrónico y, no es de extrañar, veo que mi historial de visionados en YouTube influye directamente en mis recomendaciones de carretes en Instagram, lo que me lleva a pasar más tiempo desplazándome. Todo esto demuestra que ahora es la era de la ciencia de los datos.

A medida que liberamos toneladas de datos en Internet cada día, definitivamente necesitamos más científicos de datos e ingenieros de ML que puedan liberar todo el potencial de estos datos, haciendo nuestras vidas aún más fluidas.

Recopilar datos y convertirlos en decisiones procesables es algo que exige el mundo actual. Si decide encajar en esta creciente demanda y quiere convertirse en un profesional de los datos, siga leyendo para encontrar algunos de los mejores libros de ciencia de datos.

¿Por qué libros cuando Internet es un torrente de recursos?

Why-Books-when-the-Internet-is-a-Flood-of-Resources

Es seguro decir que los recursos en línea son más eficaces que los libros, pero esto no siempre es cierto porque los lectores de libros aún no se han extinguido en este mundo digital.

La lectura de libros y los cursos en línea son dos mundos diferentes y no comparables. Pero podemos contar aquí con algunas ventajas de la lectura de libros frente a los recursos de Internet.

Domine la materia: Cuando le basta con la información general o práctica sobre un concepto, entonces la búsqueda en línea está bien, pero si quiere profundizar en el tema, desde su historia hasta sus derivaciones, entonces el libro fluye bien.

Obtenga una sensación real: ¡Los libros son reales! Por muchas reuniones virtuales a las que asista, nunca podrá captar el encanto de una reunión en persona. Así que pruebe a sostener un libro y leerlo, sentirá el peso de las páginas, el olor de la tinta y notará cómo fluyen las yemas de sus dedos sobre las palabras. Al final, le encantará.

Menos distracciones: Sé que está en Internet para aprender algo, pero apareció ante usted un clickbait sobre su programa de televisión favorito y usted hizo clic en él. Cuando se dio cuenta de que estaba perdiendo el tiempo, ya era tarde. No ocurre lo mismo con los libros. Usted sigue leyéndolos hasta que se aburre; no hay otra forma de distraerse.

Precisión: Los libros pasan por varias comprobaciones de hechos y pruebas de edición antes de publicarse, por lo que son más precisos y fiables.

Autoridad: Por lo general, los libros están escritos por profesores e investigadores expertos en la materia, mientras que los recursos de Internet pueden ser creados por cualquiera. Por lo tanto, puede confiar ciegamente en muchos de los libros.

He aquí la lista de los mejores libros de ciencia de datos que le ayudarán a sobresalir en su carrera de ciencia de datos.

Introducción a la probabilidad

Elíjalo si decide no ser un científico de datos mediocre, sino marcar su nombre en este campo, porque este libro de Introducción a la probabilidad cubre los conceptos de probabilidad detallados y avanzados que cualquier investigador de datos necesita.

Preview Product Rating
Introduction To Probability Introduction To Probability No ratings yet

Además de los conceptos tratados, el libro también incluye montones y montones de problemas de probabilidad con matemáticas limpias. Además, encontrará soluciones detalladas para todos los ejercicios de final de capítulo en la página web de la editorial de forma gratuita.

De todos modos, no recomiendo este libro a alguien que esté empezando su carrera en la ciencia de datos o en matemáticas. Necesita una base sólida en combinatoria o una buena base matemática para enseñarse a sí mismo probabilidad con este libro.

Pero cuando se tiene una base matemática decente, entonces ésta es una excelente opción si piensa aprovechar plenamente los frutos del aprendizaje de la probabilidad en su carrera de Ciencia de Datos.

El Manual de Ciencia de Datos

El Manual de Ciencia de Datos está pensado para convertirle en un científico de datos único con habilidades en ciencia de datos, programación y comprensión empresarial. Con este libro, obtendrá una experiencia de curso intensivo, pero en formato escrito.

Preview Product Rating
The Data Science Handbook The Data Science Handbook No ratings yet

El libro está escrito en un inglés sencillo, lo que resulta muy adecuado si usted es nuevo en la ciencia de datos.

Además de cubrir conceptos y algoritmos clásicos de ML, el libro también toca prácticas de ingeniería de software, memoria informática, estructuras de datos y bases de datos.

Los capítulos sobre tecnologías básicas como Python y Big data demuestran que este libro se centra en la tecnología para científicos de datos e ingenieros de ML que resuelven problemas industriales del mundo real, en lugar de dirigirse a investigadores de datos que trabajan en la publicación de su próxima revista.

Diseño de aplicaciones intensivas en datos

Este libro no es sólo para científicos de datos o analistas. Incluye todo lo que un ingeniero de software que diseña aplicaciones escalables para el mundo real, un arquitecto de software que explora aplicaciones intensivas en datos o un ingeniero de datos que procesa un gran volumen de datos necesita para aprovechar al máximo los datos en las aplicaciones modernas.

Escrito por Martin Kleppmann, investigador en sistemas distribuidos y seguridad de la Universidad de Cambridge.

El libro abarca los modelos de datos, la recuperación del almacenamiento, la codificación de datos, el particionamiento, el procesamiento por lotes y por flujos, y muchos conceptos básicos de la creación de aplicaciones modernas con uso intensivo de datos.

Si alguno de los siguientes puntos es válido para usted, este libro es una opción ideal para ampliar sus conocimientos.

  • Cómo aplicar mejor las herramientas adecuadas para resolver un problema determinado.
  • ¿Desea construir sistemas de datos escalables?
  • Optimice el rendimiento de sus aplicaciones de uso intensivo de datos en producción.
  • Aumente la flexibilidad para que sus aplicaciones puedan adaptarse fácilmente a cualquier nueva tecnología

Estadísticas al desnudo

Charles Wheelan nos muestra en Naked Statistics cómo los datos informativos y las herramientas estadísticas adecuadas pueden ayudar a construir impresionantes sistemas de recomendación que le sugieran el siguiente producto que puede añadir a su cesta o precisos sistemas de predicción que le ayuden a comprar y vender acciones.

El objetivo del libro es entrenar su mente para inferir intuitivamente análisis estadísticos a partir de la información de que dispone. Temas como Estadística descriptiva, Inferencia, Correlación y Análisis de regresión en el texto le ayudarán a conseguirlo.

Lo mejor es que el libro Estadística al desnudo le enseña las matemáticas como si fueran una historia.

Métodos bayesianos para hackers

Si quiere aprender programación probabilística desde un punto de vista bayesiano, este libro es todo lo que necesita. El término «Hackers» del título puede inducir a error, así que consideremos hackers a las personas a las que les gusta explorar y aprender enfoques y métodos complejos bayesianos.

El libro comienza enseñándole la inferencia bayesiana, y después se ensucia las manos construyendo su primer modelo bayesiano utilizando el contexto posterior del texto.

Cuenta con ejercicios prácticos e implementaciones de código para aplicar las técnicas bayesianas a problemas del mundo real. Podrá ver la aplicación bayesiana en diversos sectores como las finanzas y el marketing.

Además, este libro es de especial interés si le gustan las herramientas de Python como NumPy, SciPy y Matplotlib y tiene conocimientos de programación.

ML práctico con Scikit-Learn

Hoy en día, cualquier persona con poca o ninguna experiencia en programación es capaz de crear sistemas inteligentes capaces de aprender de los datos y tomar decisiones. ¿Usted también quiere saber cómo?

Aurélien Géron, el autor de este mejor libro de ciencia de datos, le enseña cómo puede construir un sistema inteligente de ML utilizando los dos marcos plug-and-play de Python: Scikit-learn y TensorFlow.

Este libro práctico de aprendizaje automático le muestra cómo puede construir sistemas de aprendizaje automático de principio a fin, utilizando todo el potencial de Scikit-learn a la vez que requiere una codificación mínima por su parte. Además, se pondrá manos a la obra con el entrenamiento, la construcción y el escalado de modelos de redes neuronales con TensorFlow.

Está escrito en un tono amigable, y créame, nunca esperé que un libro de ML fuera tan llevadero, con menos derivaciones matemáticas importantes y más aspectos interesantes del ML.

Aprendizaje profundo con Python

Es habitual encontrar el aprendizaje profundo como una sección o un capítulo en muchos libros de aprendizaje automático y ciencia de datos. Pero debe tener en cuenta que ambas áreas son temas muy amplios a su manera.

Preview Product Rating
Deep Learning with Python, Second Edition Deep Learning with Python, Second Edition No ratings yet

Así pues, el propósito de este Aprendizaje profundo con Python de François Chollet es ayudarle a especializarse exclusivamente en los temas centrales del aprendizaje profundo.

El libro incluye previsión de series temporales, clasificación de textos, generación de imágenes y muchos más conceptos avanzados de aprendizaje profundo.

Todos los códigos del libro están listos para ejecutarse y pueden descargarse gratuitamente. Como era de esperar, el autor de este libro y el creador de Keras son la misma persona.

Así pues, el libro es una mezcla perfecta de escritura concisa, autor experto y código ejecutable.

Big Data: Una revolución

¿Está aburrido de la codificación y los tecnicismos en el aprendizaje automático y quiere profundizar en el impacto real de los datos en el mundo actual?

Entonces le conviene este libro sobre big data, escrito por Viktor Mayer-Schönberger, profesor de Gobernanza y Regulación de Internet en el departamento del Instituto de Internet de la Universidad de Oxford.

El libro comienza con el modo en que las industrias, incluida la Administración, recopilan datos sobre todo y cómo los utilizan. A continuación, pasa a hablar de la privacidad de los datos y los riesgos asociados a ella. Por último, cierra con las posibilidades futuras y las limitaciones de los grandes datos.

Análisis práctico de datos con Pandas

Cualquiera puede importar una biblioteca y llamar a una función, pero inventar ideas a partir de los datos en bruto o mostrarle resultados desconcertantes en visuales sencillos es lo que diferencia a los científicos de datos. Por no mencionar que Pandas es la primera herramienta que debe conocer para realizar tareas tan intuitivas.

Tanto si es un principiante como un experto mago de los datos, este libro práctico de análisis de datos con Pandas muestra todos y cada uno de los trucos que necesita para explorar, analizar y manipular datos utilizando Pandas. Aprenderá a resumir estadísticas en el análisis exploratorio de datos y a encontrar patrones mediante visualizaciones claras.

Trabajando en los ejercicios de final de capítulo, desarrollará gradualmente habilidades para manejar datos del mundo real en su trabajo profesional. Puede acceder a todos los archivos y códigos de este libro en GitHub.

Ciencia de datos práctica con Python

El autor Nathan George comienza este mejor libro de ciencia de datos práctica con la programación en Python y, a continuación, le lleva a los conceptos básicos de la ciencia de datos y los codifica en Python. Le guía a través de cada fase de la ciencia de datos, desde el análisis de datos hasta las pruebas de rendimiento.

Las implementaciones del código en el libro se desglosan en trozos más pequeños y digeribles, creando un tono conversacional para usted. Y lo que es más importante, puede acceder a cada fragmento de código de este libro en GitHub de forma gratuita.

Pandas, SciPy y sci-kit-learn son las principales bibliotecas y marcos de Python que utilizará a lo largo del libro.

Programación en R para la ciencia de datos

Después de Python, R está ganando impulso en la exploración de estadísticas avanzadas de datos complejos. Por lo tanto, estoy aquí con otra recomendación de texto si desea adentrarse en la Ciencia de Datos utilizando R.

No products found.

R programming for Data Science está oficialmente disponible en línea de forma gratuita. Créame, ábralo en Edge o en su lector de PDF favorito, y no encontrará absolutamente ninguna diferencia entre su copia en línea y la gloriosa edición de tapa dura.

Este libro no es para que aprenda ciencia de datos o técnicas de ML. Sin embargo, está escrito únicamente por Roger D. Peng, profesor de Bioestadística en la Escuela de Salud Pública Bloomberg de la Universidad Johns Hopkins, para equiparle con la programación en R, una herramienta para manejar cualquier fuente de datos.

Al final del libro, debería ser capaz de utilizar cómodamente objetos R, paquetes R, funciones y expresiones regulares para la manipulación y el análisis de datos.

Para terminar

Éste es uno de los mejores listados de Internet para encontrar algunos libros perfectos para llevar sus conocimientos sobre datos al siguiente nivel. La ciencia de datos es un dominio muy amplio. Por eso he incluido algunos libros especializados en cada área, como Aprendizaje automático, Python, Análisis de datos y Programación en R, junto con algunos de los mejores libros generales sobre ciencia de datos.

A continuación, explore estas herramientas de ciencia de datos que también deberían ayudarle a convertirse en un mejor científico de datos.