본문 바로가기

이론/AI

[인공지능] 자연언어 처리의 '파싱' 인트로 1) 파싱이란? 2) 파싱시 공통적 고려사항 2가지 3) 상향식 파싱과 하향식 파싱 트리 구하기 4) 파싱 기법과 관련된 모호성 1) 파싱이란? '파싱'은, 입력문장을 문장에서, 의미있는 단위(토큰, token)들에 해당하는 계층 구조로 변환하는 작업이다. 자연언어처리에서 파싱에서는 주어/동사/목적어와 같은 문장 요소들을 분리하여 파싱트리(parsing tree)로 나타낸다. 대표적인 파싱 기법에는 확장 전이망 (Augmented Transition Network, ATN) , Tomita 파싱 , 차트 파싱 등이 있다. 2) 파싱시 공통적 고려사항 2가지 1) 언어에서 허용하는 문장의 구조를 형식적으로 정의하는 체계인 문법 2) 파싱 기법에 따라 문장의 구조를 문법에 따라 분석하는 방법 문장 구.. 더보기
[인공지능] 자연어 처리(문법, 형태소 분석) 인트로 오늘은 자연어 처리의 문법에 관해서 글을 쓰겠습니다. 1) 무제약 문법 2) 문맥 의존 문법 (자연어) 3) 문맥 자유 문법 (프로그래밍 언어) 4) 정규 문법 5) 형태소 분석 과정 1. 무제약 문법 - 가장 일반적인 문법, 앞뒤에 있는 ∮들을 '문맥'이라고 한다. ∮A∮ -> ∮W∮ A∈ (N∪T)* - {ε} W∈(N∪T)* ∮ ∈(N∪T)* 2. 문맥의존 문법 - 무제약 문법과 달리 문맥의존 문법을 보면 A는 반드시 non- terminal이여야 한다. ∮A∮ -> ∮W∮ : 앞뒤에 있는 ∮들을 문맥이라고 한다. a) A∈ N b) W∈ (N∪T)* - {ε} c) ∮ ∈(N∪T)* 3. 문맥 자유 문법 A-> W 앞뒤에 있는 ∮들이 ε로 바뀌었다. A∈ N W∈ (N∪T)* - {ε} ∮.. 더보기
[인공지능] 노드의 연산, 퍼셉트론 한계 인트로 이전 글의 퍼셉트론 개념, 신경망 정의 및 특성에 이어, 퍼셉트론 노드의 연산과 그 한계에 대해 배워보겠습니다. 1) 퍼셉트론이란 (이전글 클릭) 2) 신경망 정의 및 특성 (이전글 클릭) 3) 노드의 연산 4) 퍼셉트론의 한계점 3) 노드의 연산 [퍼셉트론은 선형 분류기] 퍼셉트론은 다수의 신호를 입력받아서 하나의 신호를 출력한다. 이것은 뉴런이 전기신호를 내보내 정보를 전달하는 것과 비슷하다. 퍼셉트론은 가중치(weight)가 신호를 전달하는 역할을 한다. 가중치는 각각의 입력신호에 부여되어 계산되고 신호의 총합(y)가 임계값을 넘었을때 1, 임계값을 넘지 않았을 때는 0 또는 -1 을 출력한다. 이때 입력신호에 부여되는 weight가 클수록 더 중요한 신호임을 나타낸다. 입력 노드는 받은 신.. 더보기
[인공지능] 클러스터링 문제,해결책,한계 인트로 1) 클러스터링에 관하여 (이전글 클릭하기) - 클러스터링 정의, 데이터 클러스터링 , K-means 클러스터링 2) K-means 클러스터링 문제점, 해결책, 한계 (현재글) 1) K-means Clustering의 문제점 초기에 랜덤하게 center을 정하기 때문에, 초기에 정한 center에 따라 클러스터링이 되는 단점을 가지고 있다. (매번 클러스터링 결과가 다를 수 있다.) 단순히 K값이 많아지면, 클러스터링이 잘 되는 , 즉 순도가 높은 결과를 도출한다. K-means clustering 기법을 개선한 방법에는, Mean-shift알고리즘이 있다. 2) K-means Clustering의 문제 해결책 여러번 돌린다. (Multiple runs) initial center를 정하기 위해 .. 더보기
[인공지능][컴퓨터 비전] 시스템 및 성능평가 인트로 1. 컴퓨터 비전 시스템 개요 - 전처리, 특징 추출, 해석 2. 비전 시스템의 설계 - 문제 이해, 데이터베이스 수집, 알고리즘 설계와 구현 3. 성능평가 - Classification error , False Alarms etc. - Confusion matrix in two-class problem 컴퓨터 비전 시스템의 개요 컴퓨터 비전 시스템에는 3가지 단계가 있다. 전처리, 특징 추출, 해석 단계이다. 먼저, 전처리는 특징추출을 하기 위해 잡음을 제거하는 등의 역할을 수행한다. 1) 전처리 영상 처리 기술을 이용한 image enhancement / restoration 2) 특징 추출 Edge, line, region, texture 및 영역 특징을 검출하고 특징벡터를 추출한다. 3) .. 더보기
[인공지능] 퍼셉트론 , 신경망 인트로 인간의 뇌와 관련한 퍼셉트론 개념을 설명할 예정이고, 그에 이어 신경망 특성을 설명하였습니다. 1) 퍼셉트론이란 [인간의 뇌와 관련하여] 2) 신경망 특성 3) 노드의 연산 (다음글) 4) 퍼셉트론의 한계점 (다음글) 1. 퍼셉트론 [인간의 뇌] 인간의 뇌는 약 1000억개의 뉴런으로 구성되어 있습니다. 뉴런과 뉴런 사이에는 연결 부위인 시냅스가 있는데, 우리 몸의 신경 말단에서 자극을 받으면 화학물질이 나와 전위 변화를 일으킵니다. 이때, 전위가 임계값을 넘으면 다음 뉴런으로 신호를 전달하고, 임계값을 넘지 못하면 신호를 전달하지 않습니다. 로지스틱 회귀에서는 입력값에 따라, 입력값이 활성함수의 일정한 수준을 넘으면 TRUE, 넘지 못하면 FALSE를 반환합니다. 신경망은 이러한 인간의 뇌를 본.. 더보기
[인공지능] 클러스터링 인트로 1) 클러스터링에 관하여 - 데이터클러스터링 , K-means 클러스터링 2) K-means 클러스터링 문제점, 해결책, 한계 (다음글 클릭하기) 1) 클러스터링(군집화)이란? 특성이 비슷한 데이터끼리 하나의 그룹으로 묶어주는 기법이다. 클러스터링 알고리즘에는, 1) K-Means (Partitional clustering), 2) Hierarchical clustering 3) Graph based clustering 기법이 있다. 클러스터링을 구현하는 것은 쉬우나, 클러스터링 K(클러스터의 개수)에 따라 성능이 차이가 있으므로, 결정적으로 클러스터링 성능을 평가하는 것이 매우 어렵다. (Algorithms for clustering Data, Jain and Dubes에서) *Graph-bas.. 더보기
[인공지능] 자연 언어 처리 목차 1) 자연언어 처리의 분석 단계 - 형태소분석, 구문분석, 의미분석, 실용분석 2) 실용 분석 단계의 설명 3) 톰스키가 정의한 문법 4가지 1) 자연언어 처리의 분석 단계 1-1. 형태소 분석 단계 - 명사 , 조사 따위로 분리하는 단계이다. - 어휘 분석 단계이다. - 영어같은 경우는 형태소분석 단계가 해결이 되어있다 . - 형태소 분석기를 열심히 개발하고 있다. - 우리나라에서 제일 좋은 형태소 분석기는 오픈되지 않았다.(2017기준) 1-2. 구문 분석 단계 - 형태소들이 결합하여 문장이나 구절을 만드는 구문 규칙에 따라서, 문장 내에서 각 형태소들이 가지는 역할을 분석하는 단계이다. EX) 직장인은 휴일을 쉰다 (직장인은 주어, 쉰다는 서술어) 1-3. 의미 분석 단계 - 결과를 해석해서 .. 더보기