About this Course
최근 조회 8,976

다음 전문 분야의 4개 강좌 중 3번째 강좌:

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

유동적 마감일

일정에 따라 마감일을 재설정합니다.

중급 단계

완료하는 데 약 18시간 필요

권장: Se estima una dedicación de 6 a 8 horas por semana....

스페인어

자막: 스페인어

다음 전문 분야의 4개 강좌 중 3번째 강좌:

100% 온라인

지금 바로 시작해 나만의 일정에 따라 학습을 진행하세요.

유동적 마감일

일정에 따라 마감일을 재설정합니다.

중급 단계

완료하는 데 약 18시간 필요

권장: Se estima una dedicación de 6 a 8 horas por semana....

스페인어

자막: 스페인어

강의 계획 - 이 강좌에서 배울 내용

1
완료하는 데 1시간 필요

INTRODUCCIÓN

...
2 videos (Total 10 min), 8 readings
8개의 읽기 자료
Bienvenida1m
Contenidos del curso (Temario)1m
Organización del curso y evaluación5m
Sobre el certificado2m
FAQs - Generales10m
FAQs - Cuestionarios y ejercicios2m
FAQs - Certificado10m
Enlaces relacionados1m
완료하는 데 1시간 필요

LA MÁQUINA VIRTUAL

<b>ATENCIÓN: Si ya te instalaste la máquina virtual en el curso anterior de la Especialización no es necesario que vuelvas a hacerlo. En caso contrario, sigue leyendo.</b><br><br>Los ejercicios y sesiones prácticas pretenden mostrar un caso práctico de procesamiento y análisis de datos en el contexto de Big Data. En este sentido, será necesario trabajar con una máquina virtual que ya trae configuradas e instaladas una serie de componentes habituales al manejar Big Data. En este apartado te explicamos cómo descargar e instalar la máquina virtual Cloudera en tu ordenador. La MV-Cloudera requiere disponer de un equipo con las siguientes características: (1) máquina de 64 bits, (2) mínimo 6G de memoria (recomendable 8G), y (3) 20G disponibles en disco.<br><br> <i><b>Ten en cuenta que bajar e instalar la máquina virtual te llevará tiempo dado el tamaño y complejidad de la misma</i></b>

...
4 videos (Total 16 min), 4 readings
4개의 동영상
Instalación de la máquina virtual - Pyspark setup4m
4개의 읽기 자료
Link para la descarga de la MV_Cloudera10m
Instalación de la MV - Import start10m
Instalación de la MV - Tips10m
Instalación de la MV - Pyspark setup10m
완료하는 데 2분 필요

MATERIAL DE PRÁCTICAS Y FICHEROS DE TRABAJO

Para poder seguir la parte aplicada del curso, responder a los cuestionarios y trabajar con las herramientas que te explicamos, necesitarás acceder a una serie de ficheros de código, así como las bases de datos de trabajo, que hemos recopilado y comprimido. Verás que algunos vídeos llevan un código entre paréntesis que coincide con el nombre de alguno de estos ficheros. Esto significa que en el vídeo correspondiente se trabaja con dicho fichero. <br><br>A continuación te explicamos como incorporarlos en la máquina virtual.

...
2 readings
2개의 읽기 자료
FICHEROS DE TRABAJO Y PAQUETES - IMPORTANTE1m
INICIO DE LA SESIÓN - IMPORTANTE1m
완료하는 데 2시간 필요

MÓDULO 1 - Análisis Exploratorio de Datos

Durante la primera semana del curso se introducen el curso y las herramientas que se emplearán. Además también se presentan las tareas relacionadas con el Análisis Exploratorio de Datos. Cada pocos temas tratados en los vídeos encontrarás un pequeño custionario de 5 preguntas. <br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>

...
10 videos (Total 84 min), 6 quizzes
10개의 동영상
Caso de estudio y herramientas4m
Introducción a Jupyter Notebook y Pyspark (S1E4.ipynb)5m
Exploración de la estructura de datos (S1E5.ipynb)14m
Primera etapa del análisis exploratorio (S1E6.ipynb)11m
Preproceso de datos (I) - (S1E7.ipynb)11m
Preproceso de datos (II) - (S1E8.ipynb)6m
Segunda etapa del análisis exploratorio (S1E9.ipynb)14m
6개 연습문제
Cuestionario 110m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
2
완료하는 데 3시간 필요

MÓDULO 2 - MODELOS DE REGRESIÓN

En el módulo 2 del curso se introducen conceptos de modelización generales (calibración y validación) y en particular los modelos de regresión lineal y regresión logística. Desde la perspectiva de Big Data, se incluyen aspectos relacionados con la regularización de los modelos para su simplificación. <br><br><i>Como en el módulo anterior, visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>

...
10 videos (Total 89 min), 7 quizzes
10개의 동영상
Resultado de la Modelización11m
Regresión Simple (S2E4.ipynb)11m
Nuevas variables (S2E5.ipynb)8m
Regresión Múltiple (I) (S2E6.ipynb)7m
Regresión Múltiple (II) (S2E7.ipynb)11m
Regresión Logística (I) (S2E8.ipynb)8m
Regresión Logística (II) (S2E9.ipynb)10m
7개 연습문제
Cuestionario 110m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Cuestionario 710m
3
완료하는 데 3시간 필요

MÓDULO 3 - ÁRBOLES DE REGRESIÓN Y CLASIFICACIÓN

En el módulo 3 del curso se introduce la família de modelos basada en árboles (clasificación, regresión, bosques) y aspectos generales sobre la incertidumbre y el sobreajuste. Después de cada tema, o de unos pocos temas, encontrarás un cuestionario para comprobar tu nivel de comprensión de los mismos.<br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>

...
10 videos (Total 89 min), 7 quizzes
10개의 동영상
Concepto de Árbol8m
Árboles de Regresión11m
Modelización con Árboles de Regresión (S3E5.ipynb)9m
Árboles de Clasificación9m
Modelización con Árboles de Clasificación (S3E7.ipynb)9m
Bosques Aleatorios14m
Modelización con Bosques Aleatorios (S3E9.ipynb)9m
7개 연습문제
Cuestionario 18m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Cuestionario 710m
4
완료하는 데 3시간 필요

MÓDULO 4 - REDES NEURONALES Y TÉCNICAS NO SUPERVISADAS

En el módulo 4 del curso se introduce la família de modelos basada en redes neuronales así como se introducen las técnicas básicas no supervisadas, tanto de clasificación automática como de reducción de la dimensionalidad. En este módulo, además de los cuestionarios convencionales, tendrás que realizar un trabajo práctico en el que trabajarás las técnicas aprendidas hasta el momento.<br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, realiza el ejercicios práctico, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>

...
10 videos (Total 75 min), 1 reading, 7 quizzes
10개의 동영상
Introducción al reconocimiento de patrones5m
Reducción dimensión11m
Análisis de componentes principales (S4E6.ipynb)10m
Clasificación automática8m
Análisis de clústers (S4E8.ipynb)7m
Revisión de la ciencia de datos (I)5m
Revisión de la ciencia de datos (II)6m
1개의 읽기 자료
TRABAJO PRÁCTICO - Enunciado30m
7개 연습문제
Cuestionario 110m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Cuestionario del Ejercicio Práctico30m
4.3
5개의 리뷰Chevron Right

Big Data: procesamiento y análisis의 최상위 리뷰

대학: RMApr 2nd 2019

Me gusto el curso de Procesamiento y Análisis, este hace un manejo de grandes volúmenes de datos con jupyter de python.

강사

Avatar

Llorenç Badiella

Director Servei d'Estadística Aplicada UAB
Universitat Autònoma de Barcelona
Avatar

Isabel Serra

Doctora
Centre de Recerca Matemàtica

바르셀로나 자치대학교 정보

The Universitat Autònoma de Barcelona (UAB) is a public university located in the metropolitan area of Barcelona. International in its outlook, it is fully consolidated within its local surroundings, and offers quality education in close association with research activity, the transfer of scientific, technological, cultural and educational knowledge, the promotion of its human potential and the responsible management of available resources. The UAB currently offers 81 degrees, 130 official Master Programmes and 183 UAB-specific Masters Degrees. In addition, it offers 174 lifelong learning programmes and 65 PhD Programmes, 27 of which have been distinguished through Quality Awards. The UAB has a total of over 3,500 teaching and research staff, over 2,000 administrative staff and over 40,000 students....

Big Data – Introducción al uso práctico de datos masivos 전문 분야 정보

Este programa, de 4 cursos más un proyecto final, está pensado como una entrada al mundo de los datos masivos y su tratamiento. El primer curso tiene como objetivo mostrar al estudiante el impacto del Big Data en la sociedad actual, tanto en el mundo de los negocios como en el de la política y administraciones públicas, los medios de comunicación, y/o la investigación científica. A lo largo de los cursos 2, 3 y 4 se estudian la identificación, captura, pre-procesamiento, análisis y visualización de datos, desde un punto de vista “usuario”, y con una orientación práctica. Finalmente, el Capstone Project permite al estudiante utilizar en conjunto las herramientas y conceptos vistos en los cursos precedentes en un campo donde el concepto “Big Data” es innegable: el estudio de las galaxias. Al finalizar los cursos de esta especialización el estudiante será capaz de: 1. Entender el impacto del tratamiento de datos masivos en la sociedad actual 2. Entender y explicar la procedencia y características de los datos masivos. 3. Adquirir, preparar, almacenar, analizar, visualizar y manejar grandes conjuntos de datos 4. Extraer información de los datos 5. Trabajar dentro del ecosistema Hadoop 6. Contestar a una pregunta bien formulada en función de la información disponible (capstone project) Contamos con un conjunto maravilloso de profesores, con una gran experiencia en el tema, provenientes tanto de la universidad como de la empresa....
Big Data – Introducción al uso práctico de datos masivos

자주 묻는 질문

  • 강좌에 등록하면 바로 모든 비디오, 테스트 및 프로그래밍 과제(해당하는 경우)에 접근할 수 있습니다. 상호 첨삭 과제는 이 세션이 시작된 경우에만 제출하고 검토할 수 있습니다. 강좌를 구매하지 않고 살펴보기만 하면 특정 과제에 접근하지 못할 수 있습니다.

  • 강좌를 등록하면 전문 분야의 모든 강좌에 접근할 수 있고 강좌를 완료하면 수료증을 취득할 수 있습니다. 전자 수료증이 성취도 페이지에 추가되며 해당 페이지에서 수료증을 인쇄하거나 LinkedIn 프로필에 수료증을 추가할 수 있습니다. 강좌 내용만 읽고 살펴보려면 해당 강좌를 무료로 청강할 수 있습니다.

궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.