Tecnologías
Debido al gran potencial, posibilidad de automátización, a la integráción completa que ofrecen y no por último al precio reducido (ó gratuito en algunos casos) recomendamos las siguientes herramientas:
BI - Business Intelligence: Power BI (Microsoft)
Desarollo & Machine Learning: Python y R,
RPA (Automatización Robótica de Procesos: Python y soluciones dedicadas.
BBDD - Bases de datos: PostgreSQL, SQLite
Storage (cloud) Almacenamiento y trabajo colaborativo: Sharepoint, One Drive, Google Drive.
Técnicas y métodos
Los métodos y técnicas elegidos se adaptan al modelo de datos y se realiza con aplicaciones específicas de estadísticas e Inteligencia de Negocio.
Estadística Descriptiva
- Representaciones gráficas
- Medidas de posición y dispersión
- Tablas de contingencia
Calculo de Probabilidades
Modelos unidimensionales discretos y continuos y asociados a distribuciones normales
Modelos multidimensionales
Estadística Inferencial
- Estimación, Intervalos y Test para una y dos muestras
- Análisis de la Varianza (ANOVA)
- Regresión Lineal y Correlación
- Contrastes de Hipotesis (bondad, homogeneidad, independencia)
- Contrastes no parametricos (normalidad, rangos, varianza, signos)
- Contrastes relativos a una muestra y datos apareados
Reduccion de dimensiones
- Análisis de Comonentes Principales (PCA)
- Análisis Discriminante Lineal (LDA)
- Análisis de Correlacion
Otras técnicas
- Análisis de Correspondencias
- Regresion Lineal
- Análisis de supervivencia
- Correlaciones
- Ponderaciones
Minería de datos y Machine Learning
... conjunto de técnicas y tecnologías que permiten explorar grandes vlumenes de datos con el objetivo de encontrar patrones frecuentes, asociaciones, correlaciones, estructuras causales entre conjuntos de objetos (datos) o patrones temporales. El Data Mining se utiliza entre otros campos en : marketing, publicidad, ventas y segmentación y fidelizacion de clientes, análisis de cesta de la compra, predicción de ventas, etc.
Enumeramos algunas de las técnicas más conocidas:
- Asociación: la relación entre distintos objetos de una transacción con el fin de predecir patrones.
- Clasificación: se utiliza aprender diferentes funciones que clasifiquen los datos dentro de un conjunto predefinido de clases.
- Clustering (segmentación): K-vecinos mas cercanos (k-NN) el analisis que toma datos sin agrupar y mediante el uso de técnicas automáticas realiza la agrupación de estos.
- Predicción/Estimación (técnicas de regresión)
- Series Temporales (pronostico): a partir de datos históricos junto con técnicas de regresión lineal o no lineal, se pueden aislar e identificar patrones por ciertos periodos de tiempo y obtener curvas de regresión y predicciones.