Eat Study Love

먹고 공부하고 사랑하라

Data Science/Research 36

SQL2NL 모델 추가 실험(VectorDB, Embedding)[2]

https://eglife.tistory.com/362 SQL2NL 모델 추가 실험(VectorDB, Embedding)[1]https://eglife.tistory.com/361 SQL2NL 모델 실험진행(2)https://eglife.tistory.com/360 SQL2NL 모델 실험진행https://eglife.tistory.com/359 SQL2NL 모델 개선방안에 대한 검토 - Prompt & RAGhttps://eglife.tistory.com/358 연구주제 고찰eglife.tistory.com이전 시간에, 대강 SQL에 적합한 Feature를 통해서 해당 항목 기준으로 Embedding 하는 것까지 완료 했다. 근데 오늘 Embedding Model에 대한 세미나를 듣다보니 이렇게 접근하는..

SQL2NL 모델 추가 실험(VectorDB, Embedding)[1]

https://eglife.tistory.com/361 SQL2NL 모델 실험진행(2)https://eglife.tistory.com/360 SQL2NL 모델 실험진행https://eglife.tistory.com/359 SQL2NL 모델 개선방안에 대한 검토 - Prompt & RAGhttps://eglife.tistory.com/358 연구주제 고찰(2)MCP를 많이 파봤지만, 일단 연구주제는 SQL2NLeglife.tistory.com아무래도 DB를 중점적으로 다루는 교수님을 만났다 보니까 모든 연구에 DB가 묻어있기를 바라시는 거 같다.아래, 내 Flow도 SQL2NL은 NL2SQL 연구의 '검증' 용으로 쓰일 예정이며 이 때문에 LLM의 자연어반환은 거의 99%에 가까운 정확도를 보여야 한다는 ..

SQL2NL 모델 실험진행(2)

https://eglife.tistory.com/360 SQL2NL 모델 실험진행https://eglife.tistory.com/359 SQL2NL 모델 개선방안에 대한 검토 - Prompt & RAGhttps://eglife.tistory.com/358 연구주제 고찰(2)MCP를 많이 파봤지만, 일단 연구주제는 SQL2NL이 위주였으면 한다는 교수님의 바람이 있eglife.tistory.com이제 진짜 실험진행 + Data를 뽑아볼 때가 왔다.실험의 관건은 SQLGlot이 얼마나 유의미한가..를 따져보는 것이다. 기존 BIRD Data set 1534ea에서 DB용 1434ea, test용 100ea를 분류해서 실험을 진행한다.아 댕짜증나는게 실험 하기도 전에 Module 끼리 버전 맞추는 것만 해도 ..

SQL2NL 모델 실험진행

https://eglife.tistory.com/359 SQL2NL 모델 개선방안에 대한 검토 - Prompt & RAGhttps://eglife.tistory.com/358 연구주제 고찰(2)MCP를 많이 파봤지만, 일단 연구주제는 SQL2NL이 위주였으면 한다는 교수님의 바람이 있었다. 그래야 연구실에서 활발히 진행중인 NL2SQL 연구와 엮어서 또eglife.tistory.com지난 시간에, 실험 기획은 다 짰다.이제 본격적으로 실험을 슉슉슉 진행해보자. 실험준비1. SQL 간 Strucutre Similarity 계산 Equation 확립2. Data Set 준비 실험절차 1. Data Set 준비-> BIRD / Spider 2. Data-Set Vector Embedding-> 문제발생😥 :..

SQL2NL 모델 개선방안에 대한 검토 - Prompt & RAG

https://eglife.tistory.com/358 연구주제 고찰(2)MCP를 많이 파봤지만, 일단 연구주제는 SQL2NL이 위주였으면 한다는 교수님의 바람이 있었다. 그래야 연구실에서 활발히 진행중인 NL2SQL 연구와 엮어서 또 하나의 논문이 나올 수 있다는 관점! 뭐..eglife.tistory.com SQL to NL Model을 좀 검토해보기로 하고, 개선방안은 기존 NL2SQL 연구 트랜드를 벤치마크한다. 위 연구주제 고찰(2) 글에서 첫 번째 연구주제에 대한 내용이다. 빠르게 설계를 해보자. 일단 주제는, Generative AI ( Large Language Model ) 을 이용한 SQL to NL Framework이고, 연구는 Model Finetuning / Prompt Engin..

연구주제 고찰(2)

MCP를 많이 파봤지만, 일단 연구주제는 SQL2NL이 위주였으면 한다는 교수님의 바람이 있었다. 그래야 연구실에서 활발히 진행중인 NL2SQL 연구와 엮어서 또 하나의 논문이 나올 수 있다는 관점! 뭐.. 공감한다. 얼마 남지 않은 시간, 다층적으로 봐보자1. 지난 KCC에선 SQL2NL을 위한 Prompt Engineering을 주제로 논문을 썼다. 그렇게 하다보니, 각종 Evaluation Matrix를 통해서 NL간 Semantic 유사성을 측정할 수 있었고, 이것으로 뭔가 실험을 진행할 수 있었다. 이 번에도 SQL2NL 연구를 하나 진행하고, 이 또한 K-DS에 제출하고 싶은데 어떤 방법론이 있을지 모르겠다. 나도 'CodeLens: a generative ai framework for dy..

연구주제 고찰

슬 연구주제를 정해야 하는데, 지도교수님과 논의해봤을 땐 아래와 같이 AI를 이용한 SQL Dynamic Feedback과 관련된 연구가 어떻게냐고 말씀하신다.https://www.ideals.illinois.edu/items/134463 CodeLens: a generative ai framework for dynamic feedback on SQL semantic errors | IDEALSUniversity of Illinois Urbana-Champaign Academic Units Graduate Dissertations and Theses at Illinois Graduate Dissertations and Theses at Illinois CodeLens: a generative ai fra..

MCP in PostgreSQL(2)

https://eglife.tistory.com/350 MCP in PostgreSQL(1)https://eglife.tistory.com/349NL transfer in PostgreSQL 뭘 더 해야 할까?" data-og-description="https://eglife.tistory.com/348 Llama3 Prompt Engineering(7)https://eglife.tistory.com/347 Llama3 Prompt Engineering(6)https://eglife.tistory.com/340 Postgreglife.tistory.com 지난 시간에, Model Context Protocol 활용을 위한 개념공부를 좀 했으니, 이번엔 본격적으로 구현을 해보려고 한다.그 전에,, MCP에..