Reproducir vídeo

Técnico en minería de datos

¿Qué es un Técnico en minería de datos?

Data Mining es un conjunto de técnicas y tecnologías que ayudan a explorar grandes bases de datos, de forma automática o semiautomática, con el objetivo de encontrar patrones repetitivos que den explicaciones al comportamiento de estos datos. Partiendo de eso, ¿te ves capacitado/a para formarte como técnico en Data Mining minería de datos? Desde Euroinnova si te vemos, por eso queremos que nos acompañes en este recorrido y te informes de todo antes de tomar una decisión. ¡Pongámonos manos a la obra!

Objetivos generales

¿Qué pasos debe dar un técnico en Data Mining minería de datos para realizar un análisis?

  • Determinación de los objetivos: El cliente fija qué objetivos quiere conseguir gracias al uso del Data Mining.
  • Procesamiento de los datos: Selección, limpieza, enriquecimiento, reducción y transformación de la base de datos.
  • Determinación del modelo: Primero se debe hacer un análisis estadístico de los datos y después estudiamos la gráfica de los mismos.
  • Análisis de los resultados: En este paso se deberán aprobar si los resultados obtenidos son coherentes.

¿Qué diferencias existe entre Data Mining y Big Data?

Todo técnico en Data Mining minería de datos, debe tener clara esta diferencia desde el primer momento, ya que de esta manera se librará de muchos calentamientos de cabeza.

El Big Data es una tecnología que tiene la capacidad de obtener, gestionar y procesar de forma veraz todo tipo de datos, usando herramientas o softwares que identifican patrones comunes. A diferencia del Big Data, tal y como hemos dicho anteriormente, cuando hablamos de Data Mining nos referimos al análisis de los grandes datos o Big Data para encontrar y obtener una información específica, y así, poder dar resultados que ayuden como solución para optimizar las actividades de una empresa.

Con otras palabras, Big Data y Minería de datos podrían ser definidos como el “activo” y el “manejo”, respectivamente.

Lo que aprenderás

Lección 1         

  • Metodologia KDD
  • Metodologia CRISP-DM
  • Metodologia SEMMA
  • Medidas de seguridad y salud laboral
  • Identificación de patrones

Lección 2

  • Instalación de R y RStudio
  • Interfaz de RStudio
  • Variables, datos y operadores en R I
  • Tipos de objetos en R
  • Estructuras de control en R
  • Uso de vectores
  • Operaciones con matrices
  • Uso de listas
  • Uso de Data Frames
  • Operaciones con vectores

Lección 3

  • Instalación de MySQL
  • Comandos básicos de sQL
  • Instalación de RMySQL
  • Operaciones básicas con una base de datos desde R
  • Importación y exportación de base de datos a R
  • Extracción de datos

Lección 4

  • Edición de video
  • Subiendo un video a una página web
  • Editando video

Lección 5

  • Elaboración de documentos: Redacción de citas y bibliografía
  • Citas y bibliografía 

Lección 1

  • Medidas de tendencia central
  • Medidas de dispersión
  • Pruebas paramétricas y no paramėtricas
  • Distribución normal
  • Elaboración de gráficos
  • Cálculo de medidas principales

Lección 2

  • Características de una muestra
  • Técnicas de muestreo
  • Intervalos de confianza
  • Coeficiente de correlación
  • Análisis de una muestra

Lección 3

  • Tipos de algoritmo
  • Algoritmo de clúster
  • Algoritmo de K-medias
  • Algoritmo de árboles de decisión
  • Agrupación con el algoritmo clúster

Lección 4

  • Algoritmo de regresión logistica
  • Algoritmo de series
  • Algoritmo de regresión lineal
  • Algoritmo de asociación
  • Algoritmo de Bayes ingenuo
  • Reportes
  • Asociación en R

Lección 1

  • Análisis de valores ausentes
  • Análisis de componentes principales
  • Bootstraping
  • Remuestreo con Bootstrap

Lección 1

  • Algoritmo de red neuronal
  • Topologia de redes neuronales
  • Curva ROc Infografia
  • Tecnologías para el análisis de datos
  • Red neuronal e inteligencia artificial