(졸업논문에 사용한 데이터셋 및 기본적인 연구 방법에서 발전한 미니 프로젝트)
-
목표
- 뉴스 기사의 sentiment 추출.
- sentiment가 IPO 초기수익률에 미치는 영향 파악.
-
데이터 수집
- 모델 학습에 사용할 데이터셋
- 금융 뉴스 문장 감성 분석 데이터셋(finance sentiment corpus)
- IPO 기업에 관한 뉴스 기사 데이터셋
- 크롤링을 통한 직접 수집(BeautifulSoup, Selenium)
-
모델 선정
- 모델 : KoBERT
- 토크나이저 : SKTBrain에서 학습한 토크나이저(SentencepieceTokenizer)
-
금융 뉴스 문장 감성 분석 데이터셋

| neutral |
2879 |
| positive |
1363 |
| negative |
604 |
|
train |
test |
| Epoch 1 |
0.6097 |
0.7941 |
| Epoch 2 |
0.8161 |
0.8142 |
| Epoch 3 |
0.8890 |
0.8123 |
| Epoch 4 |
0.9259 |
0.8390 |
| Epoch 5 |
0.9626 |
0.8396 |
-
IPO 기업에 관한 뉴스 기사 데이터셋
-
89642 row X 11 column
-
IPO 진행한 기업 : 630 곳
-
수집 기간 :
- IPO 진행하는 기업 상장 한달 전 ~ IPO 진행하는 기업 상장 전날
-
뉴스 기사 별 감성 측정
| neutral |
39932 |
| positive |
33524 |
| negative |
16186 |
-
다중회귀분석 결과
- 선행 연구 결과와 동일하게 기관경쟁률, 의무보유확약은 IPO 초기수익률에 긍정적인 유의미한 영향을 미침.
- 이와 비슷한 수준으로 모델로 측정한 감성 또한 긍정적인 유의미한 영향을 미침.
- 물론, 의무보유확약이 가장 높은 상관계수를 가지면서 유의미한 영향을 미치지만, 선행연구에서 유의미한 영향을 끼쳤던 기관경쟁률과 비슷한 수준으로 감성 변수도 영향을 끼치는 것을 확인할 수 있음.
