지난 글에 언어모델에 Dense vector 가 왜 언어모델에서 쓰이는지에 대하여 글을 작성했다. 기존 언어모델의 문제점word-embedding은 context에 independent 하다.단순히 짧은 맥락 말고, 멀리있어도 인지하고 싶다.ex) apple은 과일일 수도있고, 회사이름일 수 있는데 판별하지 못한다. FFN(MLP)Feedforward network로 다층퍼셉트론을 이용한 모델이다. input = x= [x1,x2,x3...]1layer =hidden layer = h = sigmoid(wx + b)2layer = z =UH3layer = y = softmax(z)loss function = cross-entropy FFN을 통한 simple neural language model..