Este curso te brindará los conocimientos necesarios para la extracción, limpieza y preparación de distintas fuentes de datos para ser incluidos en un proceso de NLP.
Limpieza de datos para el procesamiento de lenguaje natural
아우스트랄 대학교이 강좌에 대하여
Conocimientos de programación de nivel básico a medio, deseable: conocimiento básico lenguaje Python y el entorno de Jupyter Notebooks de Anaconda.
Conocimientos de programación de nivel básico a medio, deseable: conocimiento básico lenguaje Python y el entorno de Jupyter Notebooks de Anaconda.
제공자:

아우스트랄 대학교
La Universidad Austral se propone servir a la sociedad a través de la búsqueda de la verdad, mediante el desarrollo y transmisión del conocimiento, la formación en las virtudes y la atención de cada persona según su destino trascendente, proponiendo un estilo de liderazgo intelectual, profesional, social y público.
강의 계획표 - 이 강좌에서 배울 내용
Web Scraping para Procesamiento de Lenguaje Natural
Este módulo te permitirá obtener los conocimientos necesarios para la construcción de un programa de extracción de datos de páginas Web basadas en HTML.
HTML Parsing para Procesamiento de Lenguaje Natural
En este módulo se describen un conjunto de pasos necesarios para el pre procesar páginas HTML y extraer información de ellas. Además, se detallarán distintos tipos de aproximación al mismo.
Técnicas avanzadas de Scraping
En este módulo se presentarán las técnicas avanzadas de scraping para extracción de datos de páginas HTML que utilizan diversas librerías de JavaScript para su construcción
Técnicas de Manipulación de texto
Una vez estriado el texto de las paginas HTML que es una fuente habitual de extracción de información, se pueden sumar distintas fuentes de tipos de datos, como ser PDF, DOC, XLS e imágenes. En este módulo se verán diversas técnicas que pueden servir para recolectar la información de ellas y unificarlas en un mismo conjunto de documentos.
자주 묻는 질문
강의 및 과제를 언제 이용할 수 있게 되나요?
이 수료증을 구매하면 무엇을 이용할 수 있나요?
재정 지원을 받을 수 있나요?
궁금한 점이 더 있으신가요? 학습자 도움말 센터를 방문해 보세요.