본문 바로가기
728x90

전체 글79

[H4CKING GAME] Easy 풀이문제 파일을 다운로드 받아 보았더니 이렇게 검정색 사진이 보였다.. 스테가노그래피 문제인 것 같아 stegonline을 활용하여 풀어주었다.넣고 돌려보니 이렇게 QR 코드가 나왔다.저번 문제처럼 QR코드 해독해주는 사이트에 접속해 해당 사진을 넣어주었다. 2024. 7. 9.
3부. 텍스트 마이닝을 위한 딥러닝 기법 - (2) 14. BERT의 이해와 간단한 활용14.1. 왜 언어 모델이 중요한가?언어 모델: 문장 혹은 단어의 시퀀스에 대해 확률을 할당하는 모델- 문장에 확률을 할당?: "나는 배가 고파서 밥을 먹었다." vs "나는 배고 고파서 밥을 치웠다." -> 더 자연스러운 문장 = 전자. 더 자연스러운 문장에 더 높은 확률을 부여.=> 잘 학습된 언어 모델은 문장을 잘 완성할 수 있다.  - 언어 모델을 이용한 학습이 갖는 의미? -> 언어 모델은 언어에 대한 이해를 높이는 학습이라고 할 수 있음.+ 비지도 학습이 가능하다는 것도 장점.14.2 사전학습 언어모델의 이론적 이해- w1, w2,…, w n 이 어떤 단어의 시퀀스 혹은 문장이라고 가정하면, 이 시퀀스가 나타날 확률은 각 단어들의 결합확률로 표현되며 식에서와.. 2024. 6. 3.
3부. 텍스트 마이닝을 위한 딥러닝 기법 10. RNN - 딥러닝을 이용한 문서 분류10.1. 왜 RNN일까?RNN(Recurrent Neural Networks)- 시계열 데이터(=어떤 변수의 값이 시간에 따라 변화하는 것)를 다루기 위한모형으로 알려져 있음.- 시계열 예측모형에서 가장 중요한 가정 - 앞의 값들이 뒤의 값에 영향을 미친다는 것.- 시계열 모형에서는 입력으로 일정 기간의 연속된 값을 사용함.(순차적으로 영향을 미쳤다는 점이 입력의 중요한 가정임)=> RNN은 이러한 순차적인 영향을 표현하기 위한 모형임-> 이 식에서 '과연 RNN 신경망 모형의 입력은 몆 개인가?' -> 내가 정한 수의 입력 [RNN이 문서 분류에 적합한 이유]- RNN은 앞에서부터 순차적으로 미치는 영향을 계속 축적하는 모형이기 때문에, 문장에 있는 단어의 .. 2024. 5. 29.
1부. 텍스트 마이닝 기초 01. 텍스트 마이닝 기초1.1 텍스트 마이닝의 정의텍스트 마이닝: 텍스트에서 고품질 정보를 추출하는 과정- 텍스트에 숨어 있는 패턴을 이용해 어떤 사건을 예측하는 것으로 정리할 수 있음.- 머신러닝을 통해 '패턴'을 찾을 수 있음. -> BUT, 머신러닝은 대부분 정형적인 데이터를 대상으로 하는 방법론임=> 먼저 비정형 텍스트 데이터를 정형화하는 작업이 필요함.=> 텍스트 마이닝: 자연어 처리 기법을 이용해 텍스트를 정형화된 데이터로 변환하고, 머신러닝 기법을 적용해 우리가 관심이 있는 어떤 사건을 예측하고자 하는 방법론 1.2 텍스트 마이닝 패러다임의 변화텍스트 분류 등의 작업에 BERT(딥러닝 기반)를 쓰는게 일반화됨. - BERT: 트랜스포머에 기반한 모형, 최근 작업에 거의 이 모델을 사용한다고.. 2024. 5. 28.
[서울여대_2024 RAON CTF] Protocol Level 2 보호되어 있는 글 입니다. 2024. 5. 28.
[H4CKING GAME] Gather_Around_Here DescriptionGather_Around_Here 풀이카카오톡 오픈채팅방이랑 디스코드 링크가 있길래, 디스코드 링크로 들어가보았다.그리고, 검색 창에 플래그 형식인 'H4CGM'을 검색해보았더니 플래그가 나왔다.플래그는 H4CGM{thank_you_my_fr13nd!!~!~!!!~!}  이다. 2024. 5. 27.
728x90