31 marzo 2021

Python for Oracle DBA: Guía de supervivencia Parte II

 

Continuamos con la segunda parte del artículo anterior, comencemos:

Visualización de datos


La visualización de datos es esencial para la exploración, el análisis y la comunicación de datos, lo que permite a los científicos de datos comprender sus datos y compartir esa comprensión con otros. Python tiene muchas, muchas herramientas de visualización disponibles, pero destacaremos algunas aquí.

Matplotlib es la herramienta de visualización de datos de Python mejor establecida, y se centra principalmente en gráficos bidimensionales (gráficos de líneas, gráficos de barras,
diagramas de dispersión, histogramas y muchos otros). Funciona con muchas interfaces GUI y formatos de archivo, pero tiene un soporte interactivo relativamente limitado en los navegadores web.

¿Para qué se utiliza?:

Matplotlib se utiliza para analizar, explorar y mostrar relaciones entre datos.

Interviene en:

Casi todas las empresas con científicos de datos utilizan Matplotlib en algún lugar, ya sea directamente o, a menudo, a través de Pandas o las interfaces de alto nivel creadas para científicos de datos como Seaborn, HoloViews o plotnine. Se utilizaron Matplotlib y otras herramientas de Python de código abierto para crear la primera imagen de un agujero negro en el proyecto Event Horizon Telescope.

¿Dónde aprender más? https://matplotlib.org/

Bibliotecas de visualización populares y potentes basadas en navegador que le permiten crear gráficos interactivos basados en JavaScript desde Python.

¿Para qué se utiliza?:

Bokeh y Plotly crean no solo gráficos estáticos, sino visualizaciones interactivas con panorámica, zoom, vinculación entre gráficos y otras características que le permiten trabajar en Python pero utilizan el poder de las tecnologías web modernas para compartir sus resultados ampliamente.

Interviene en:

Miles de sitios web se basan en estas herramientas, ya sea directamente o utilizando las interfaces de nivel superior hvPlot, HoloViews o Chartify (para Bokeh) o Cufflinks y plotly_express (para Plotly)


¿Dónde aprender más? https://bokeh.org y https://plot.ly/pytho


Frameworks de Python para crear aplicaciones y paneles personalizados ricos en visualización para la web
¿Para qué se utiliza?

Usar Python para crear aplicaciones personalizadas con gráficos en vivo, widgets y otros controles para compartir aplicaciones en ejecución en la web, respaldadas con el poder de Python. Cada kit de herramientas tiene su propio enfoque y fortalezas: 
  • Panel (código Pythonic simple, fácil transición de Jupyter a servidores independientes), 
  • Voila (que sirve directamente los cuadernos de Jupyter), 
  • Streamlit (aplicaciones de scripts de Python), 
  • Dash (control directo sobre el estilo HTML / CSS) , despliegue sin estado).

Interviene en:
La mejor manera de ver qué proyectos son posibles con estas herramientas es ver los ejemplos en:
  •  awesome-panel.org, 
  • voila-gallery.org, 
  • awesomestreamlit.org 
  • y dash-gallery.plotly.host

Aprendizaje Automático

El aprendizaje automático (el usado hasta la saciedad Machine Learning) es una disciplina dentro de la IA que implica desarrollar y estudiar algoritmos y modelos que las máquinas usan para aprender y realizar tareas sin estar programadas explícitamente para hacerlo. El aprendizaje profundo es un subcampo del aprendizaje automático que implica el procesamiento con redes neuronales y la informática de alto rendimiento. Estos son tres de las tecnologías de aprendizaje automático de código abierto más populares.


TensorFlow es una plataforma de aprendizaje profundo de código abierto de Google que incluye un ecosistema de herramientas y bibliotecas que permiten la creación e implementación de aplicaciones de aprendizaje profundo e inteligencia artificial. Keras es una API de alto nivel que se utiliza para crear y entrenar modelos de aprendizaje profundo, originalmente como una biblioteca separada, pero ahora se incluye con TensorFlow.

¿Para qué se utiliza?:

TensorFlow y Keras se utilizan juntos para construir, entrenar e implementar de manera eficiente modelos de aprendizaje profundo, como redes neuronales convolucionales (CNN) y redes generativas adversarias (GAN). Si descarga la última versión de TensorFlow, se incluye Keras.

Interviene en:

Airbnb usa Tensorflow para clasificar imágenes y detectar objetos a escala. Airbus usa TensorFlow para extraer información de imágenes de satélite, y Twitter usó Tensorflow para crear su línea de tiempo clasificada, que muestra a los usuarios los tweets más importantes primero.

¿Dónde aprender más? https://www.tensorflow.org/


Un marco de aprendizaje profundo de código abierto que consta de herramientas y bibliotecas fundamentales para Python AI y el desarrollo de aprendizaje automático.

¿Para qué se utiliza?:

Construir y entrenar modelos de aprendizaje profundo, como CNN y GAN. Un rico ecosistema de bibliotecas amplía las capacidades de PyTorch para el procesamiento del lenguaje natural y la visión por computadora.

Interviene en:

Salesforce, entre muchos otros, utiliza PyTorch para el procesamiento del lenguaje natural y el aprendizaje de múltiples tareas.

¿Dónde aprender más? https://pytorch.org/



Una biblioteca de aprendizaje automático potente y versátil para los conceptos básicos del aprendizaje automático, como clasificación, regresión y agrupación en clústeres. Incluye ambos Algoritmos ML supervisados y no supervisados con funciones importantes como validación cruzada y extracción de características. Scikit-learn es la biblioteca de aprendizaje automático que se descarga con más frecuencia.

¿Para qué se utiliza?:

Eficiente para el análisis predictivo y la creación de modelos de aprendizaje automático con Python. También incluye herramientas que facilitan la inclusión de modelos de aprendizaje profundo en una canalización de scikit-learn.

Interviene en:

Booking.com y Spotify utilizan scikit-learn para sus motores de recomendación. Spotify ha dicho que scikit-learn es el "paquete de ML mejor diseñado que hemos visto hasta ahora". J.P. Morgan lo usa para análisis predictivo y MARS para la gestión de la cadena de suministro.

¿Dónde aprender más? https://scikit-learn.org/stable/


Seguiremos en la tercera entrega de esta serie con:

  • Computación escalable
  • Procesamiento de imágenes

No hay comentarios:

Publicar un comentario

Por favor deja tu comentario, es valioso.