실용언어처리 (Practical Language Processing)
컴퓨터 프로그래밍 및 언어공학적 기법을 활용하여 자동으로 텍스트 또는 음성을 분석하는 방법을 습득한다. 언어데이터를 분석하여 언어학적 범주 및 관계 등의 기준에 따라 그 특성의 표지를 자동으로 태깅할 수 있는 알고리즘 및 테크닉을 학습한다. 음성의 경우 신호처리 및 실험음성학적 방법을 기반으로 한 음성데이터의 분석, 조작 등의 기법을 연습하고, 나아가 음성인식/합성을 포함한 보다 실용적인 응용을 위한 기반을 마련한다.
실용음성처리 (Practical Speech Processing)
가장 편리한 의사소통 수단인 음성을 이용한 인터페이스(Voice Interface)의 이해와 응용을 목표로 한다. 음성 신호의 특성을 이해하고, 디지털 신호 처리 및 음성 신호 처리의 기본 개념을 학습한 다음 음성인식, 음성합성 등 다양한 응용에 대해 공부한다. 음성 인터페이스와 관련된 이론과 음성인식 시스템의 이해를 위한 실습을 병행한다.
언어공학개론 (Introduction to Linguistics & Language Technology)
언어공학 분야에 대한 개요 및 필요성을 학습하고 언어공학 관련 전공 교과목을 이수하는데 필요한 기초 지식을 다룬다. 언어공학 분야에 대한 개요와 필요성을 이해하고, 언어학과 언어공학, 데이터 처리에 필요한 컴퓨터 정보 처리 이론을 학습하며, 언어 처리 및 텍스트 처리, 음성 처리에 대한 내용을 학습한다.
언어데이터분석의기초 (Primary Language Data Analysis)
음성 및 텍스트 데이터를 기반으로 한 양적 분석이 어떻게 실용적으로 응용될 수 있는지에 대해 이해한다. 기초적 통계분석 방법, 기본적인 데이터 분석 기법이 소개된다. 또한, 언어데이터 정량적 분석의 유용성과 방법론을 학습하고, 기본적인 분류와 예측 등의 연습을 통해 언어 데이터 분석의 개념을 확립한다.
언어모델을 위한 프롬프트 엔지니어링 (Prompt Engineering for Language Model)
본 과목은 생성형 AI를 효과적으로 활용하기 위한 인간 언어 기반의 의사소통 기술을 학습 것을 목표로 한다. 수업은 AI가 언어 입력을 해석하고 반응을 생성하는 과정을 이론으로 학습한 후, 이에 대한 실용적인 연습을 하는 것으로 진행된다. 수업을 통해 수강생들은 AI와의 상호작용에서 명확한 명령을 내리고 원하는 결과를 얻기 위한 전략적인 프롬프트 작성법을 배운다.
언어분석을위한기계학습 (Machine Learning for Language Data Analysis)
언어 및 음성 데이터 분석을 위한 패턴인식과 기계학습의 기본 개념을 학습한다. 언어 처리와 음성 처리에 적용되는 핵심 학습 기법을 통해 패턴인식 시스템의 구조를 이해하는 것을 목표로 한다. 본 강의는 이론과 실습을 병행하여 운영되며, 전반부에는 패턴인식과 기계학습의 기본 개념을 소개하고 HMM, DNN과 같은 주요 패턴인식 기법을 살펴본다. 후반부에는 패턴 모델링 기법을 직접 구현해 봄으로써 기계학습에 대한 이해도를 높인다.
언어분석을위한통계 (Statistics for Language Analysis)
기본적 통계 분석 기법(예:t-test, ANOVA, 단회귀분석, 카이제곱검정)을 확장해서 다양한 종류의 회귀분석과 모델링 기법을 배운다. 컴퓨터 소프트웨어(예:R, SPSS, SAS)를 사용하여 다양한 통계 분석을 실습한다. 특히, 대다수 언어 연구 데이터가 범주형 자료라는 점에 주목하여 범주형 데이터 분석에 특화된 고급 기법(예:로지스틱 회귀분석, 로그선형 회귀분석, 순서 회귀분석 등)도 소개한다.
언어분석을위한프로그래밍 (Essential Programming for Linguistics)
‘고급파이썬프로그래밍' 과목을 선 수강하여 익힌 프로그래밍 역량을 기반으로 언어 데이터 분석과 관련된 실용적인 프로그래밍 기법을 학습한다. 특히 음성 및 텍스트 데이터의 분석과 처리에 유용한 기법과 알고리즘을 다양한 문제와 예제를 통해 실습함으로써 언어 분석을 위한 프로그래밍 역량을 강화한다.
언어와논리 (Language and Logic)
컴퓨터 과학이나 소프트웨어 공학 분야에서 하드웨어나 소프트웨어에 요구되는 정형기법에 기초가 될 수 있는 내용을 다룬다. 이를 위해 집합, 관계, 기능 등의 주요 개념들을 중심으로 한 집합론, 언어 생산을 위한 형식적 알고리즘의 토대가 될 수 있는 기초형식문법, 언어의 통사, 의미, 추론 관계를 규정하는 명제논리, 술어논리 등을 기초적 수준에서 배운다.
언어와데이터베이스 (Language and Database)
다국어 음성 및 텍스트 데이터베이스를 체계적으로 수집하고 관리할 수 있는 기초를 마련한다. 대용량의 데이터를 안전하게 저장, 관리, 추출할 수 있는 RDBMS의 개념을 비롯하여 절차적 언어인 SQL이나 이와 동등한 언어에 대해 익숙해지고 실제 언어데이터를 관리하는 연습을 동반하여 응용력을 계발한다.
인지과학입문 (Introduction to Cognitive Science)
지각, 학습, 기억, 문제해결, 운동, 언어 등의 기초 인지능력을 이해한다. 인지과학이 갖는 학제적 연구의 특성에 따라 정보학, 언어학, 신경언어학, 철학, 심리학 등의 다양한 관점들을 두루 살펴보며, 이를 바탕으로 일상의 인지현상들을 종합적 시각에서 재조명한다. 더 나아가 인지 및 신경 처리과정을 구분하고 모형화하는 방식을 학습한다.
컴퓨터와언어학 (Computer and Linguistics)
컴퓨터를 이용하여 인간 언어를 처리하는 방법에 대한 기본적인 개념을 익힌다. 언어의 형태, 구문 및 의미 분석 등 언어학적 지식을 활용하여 컴퓨터 환경에서 언어가 분석 및 생성되는 방법론을 배운다. 또한 자동으로 언어를 처리하는 시스템을 사용해 보고 인간언어와 컴퓨터의 상호작용에 대한 이해를 높인다.
코퍼스와언어자료 (Corpus and Language Data)
언어정보학 개론 교과서를 강독하며 언어정보학 전반을 이해하고, 21세기 세종계획 연구성과물(말뭉치, 분석도구, 다양한 연구 논문)과 COCA Corpus를 컴퓨터 실습과 함께 공부함으로써 말뭉치를 활용하여 국어 및 영어와 관련한 코퍼스언어학적 연구를 수행할 수 있는 기초를 마련하며, 최근 인문학 연구에서 수요가 급증하고 있는 추론통계학을 코퍼스언어학에 활용하는 초보적인 기술을 배운다.