Blake Woo

ISMM24' - ESPN, Memory-Efficient Multi-vector Information Retrieval 분석

ESPN 텍사스 대학교 사람들이 쓴 논문이다. 제목부터 ESPN이라는 미국 사람 아니면 알아듣지 못할 드립을 던져놓고(ESPN은 미국 연예 및 스포츠 채널이름이다) 시작하는 이 논문은 멀티 벡터 검색에 대한 논문이다. 1. 배경지식과 문제 정의 최신 신경망 IR 시스템은 fine-tuning된 LLM을 활용하여 텍스트 문서를 dense vector ...

Google 논문 - MUVERA, Multi-Vector Retrieval via Fixed Dimensional Encodings 분석

Muvera 1. 문제 정의 Neural embedding 모델은 현대 정보 검색 파이프라인의 핵심 구성 요소가 되었다. 이는 어떤 문서를 임베딩 벡터화 했을 때 다수의 문서 중에서 가장 거리가 가까운 값일 수록 해당 문서에 가깝다는 것이 알려졌기 때문이다. 이러한 원리를 이용하여 데이터를 벡터화하여 벡터화한 데이터를 Search하는 방법들이 많이 ...

Blockchain - 개요

blockchain 1. 개요 2007년~2008년에 일어났던 미국에서 시작된 서브프라임 모기지 사태가 전 세계 금융시장의 신용 경색으로 확산되며 발생한 대규모 경제 위기로 인해 미국의 여러 은행과 기업들이 도산할 위기에 쳐하자 미국이 달러를 더 발행하여 은행 및 기업들을 구제하여 돈의 가치가 떨어지게되었다. 이에 국가의 신용에 화폐를 맡기는 구조에 ...