본문 바로가기
AI 도구

📄Open NotebookLM: 무료로 PDF 문서를 팟캐스트로 만들어보세요!🎧

by James AI Explorer 2024. 10. 8.
    728x90

    안녕하세요! 👋 오늘은 PDF 파일팟캐스트로 변신시켜 주는 또 하나의 도구, Open NotebookLM에 대해 알아보겠습니다. 저번주에는 OpenAI의 유료 언어모델을 사용하는 도구 PDF2AUDIO를 소개해드렸는데요, Open NotebookLM은 강력한 무료 오픈 소스 LLM(Large Language Model)인 Llama 3.1 405B 모델과 TTS 텍스트 음성 변환 기술을 통해 누구나 손쉽게 팟캐스트를 제작할 수 있도록 지원합니다.  이 블로그에서는 복잡한 설정이나 전문 지식 없이도 간편하게 사용할 수 있는 Open NotebookLM의 주요 기능과 작동 원리, 설치 방법, 실제 활용 예시까지 살펴보겠습니다. 🚀

    📄Open NotebookLM: 무료로 PDF 문서를 팟캐스트로 만들어보세요!🎧

    "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

    Open NotebookLM 개요

    Open NotebookLM은 오픈 소스 LLM과 텍스트 음성 변환 모델을 사용하여 PDF 문서를 오디오 팟캐스트 형식으로 변환하는 도구입니다. 구글의 NotebookLM 도구에서 영감을 받아 제작되었으며, PDF 내용을 분석하여 자연스러운 대화 형식으로 변환하고 MP3 파일로 출력합니다. Open NotebookLM 주요 기능은 다음과 같습니다. 

     

    주요 기능:

    • PDF를 팟캐스트로 변환: PDF 파일을 업로드하면 텍스트 추출 및 구조 분석 내용을 기반으로 팟캐스트 대화를 생성합니다. pypdf 라이브러리를 사용하여 PDF 문서의 각 페이지에서 텍스트를 추출하고, 
    • 흥미로운 대화 생성: 생성된 대화는 정보 제공과 동시에 재미있도록 설계되었습니다.
    • 사용자 친화적인 인터페이스: Gradio를 사용한 간편한 웹 기반 인터페이스를 제공합니다. 사용자는 별도의 프로그램 설치 없이 웹 브라우저를 통해 Open NotebookLM을 이용할 수 있습니다.
    • 다국어 지원: Open NotebookLM은 다양한 언어로 팟캐스트를 생성할 수 있도록 여러 언어를 지원합니다. (English,, Chinese, French, German, Hindi, Italian, Japanese, Korean, Polish, Portuguese, Russian, Spanish, Turkish)

    Open NotebookLM은 다양한 라이브러리와 API를 활용하여 PDF를 팟캐스트로 변환합니다.

    1. PDF 분석 및 텍스트 추출: pypdf 라이브러리를 사용하여 업로드된 PDF 파일에서 텍스트를 추출합니다. URL 입력 시에는 requests 라이브러리를 사용하여 해당 웹 페이지의 텍스트 콘텐츠를 가져옵니다.
    2. 텍스트 전처리: 추출된 텍스트는 Llama 3.1 405B 모델의 입력으로 사용하기 위해 적절한 형식으로 전처리됩니다.
    3. 대화 생성: Fireworks API에 호스팅 된 Llama 3.1 405B 모델을 사용하여 텍스트 내용을 기반으로 팟캐스트 대본을 생성합니다. 사용자는 팟캐스트에서 다루고 싶은 특정 질문을 입력하거나, 팟캐스트의 분위기(예: 재미있게, 공식적으로)를 설정할 수 있고, 팟캐스트 길이를 짧게(1-2분) 또는 중간(3-5분)으로 선택할 수 있습니다.
    4. MeloTTS 또는 Bark를 사용한 음성 합성: 생성된 대본은 각 발화자 (호스트, 게스트)에 따라 텍스트 음성 변환 엔진(TTS)을 사용하여 음성으로 변환됩니다. 영어 이외의 언어 또는 고급 오디오 생성 옵션을 선택한 경우 Bark를 사용하고, 그렇지 않은 경우 MeloTTS를 사용합니다.
    5. 음성 파일 병합 및 출력: 생성된 각 발화자의 음성은 pydub 라이브러리를 사용하여 하나의 오디오 파일로 병합되고, 최종적으로 MP3 파일로 출력됩니다.
    728x90

    Open NotebookLM 설치 방법

    Open NotebookLM을 사용하려면 먼저 시스템에 Python 환경을 구성하고 필요한 라이브러리를 설치해야 합니다. 이 블로그의 설치 환경은 Windows 11 Pro(23H2), WSL2, 파이썬 버전 3.11, Visul Studio Code 1.93.1(이하 VC)이며, "WSL 연결"을 통해 Linux 환경에서 실행하였습니다.

     

    1. 저장소 복제: 먼저, VSC 터미널에서 아래 코드를 복사해서 레포지토리를 복사하고 주 디렉토리로 이동합니다. 

    git clone https://github.com/gabrielchua/open-notebooklm.git
    cd open-notebooklm

    2. 가상 환경 생성 및 활성화: 다음은 파이썬 가상환경을 생성하고 활성화합니다 

    python -m venv .venv
    source .venv/bin/activate

    3. 필요한 패키지 설치: 가상환경이 활성환된 상태에서 Open NotebookLM 실행에 필요한 라이브러리들을 설치합니다. 

    pip install -r requirements.txt
    

    가상환경 생성 및 의존성 패키지 설치

    4. API 키 설정: Open NotebookLM은 Fireworks API에서 호스팅 되는 Llama 3.1 405B 모델을 사용하므로 아래와 같이 비주얼 스튜디오 코드 터미널에 입력하여 FIREWORKS_API_KEY 환경 변수에 API 키를 설정해야 합니다.

    export FIREWORKS_API_KEY=발급받은 API Key

    https://fireworks.ai/account/api-keys

     

    Fireworks - Fastest Inference for Generative AI

    Use state-of-the-art, open-source LLMs and image models at blazing fast speed, or fine-tune and deploy your own at no additional cost with Fireworks AI!

    fireworks.ai

     

    Open NotebookLM 실행

    Open NotebookLM을 실행하고 PDF 파일을 팟캐스트로 변환하는 방법은 다음과 같습니다.

    1. 애플리케이션 실행: 아래 명령어로 파이썬 코드를 실행하면 http://127.0.0.1:7861/ 주소에서 초기화면이 열립니다. 

    python app.py
    

    Open NotebookLM 초기화면

    2. PDF 업로드: 웹 브라우저에서 실행되는 Gradio 인터페이스에 팟캐스트로 변환할 PDF 문서를 업로드합니다.

    PDF 업로드 화면

    3. 오디오 생성: 버튼을 클릭하여 변환 프로세스를 시작합니다. 변환이 완료되면 팟캐스트 대화가 담긴 MP3 파일이 생성되고, 화면 오른쪽에 볼륨, 재생속도 조절이 가능한 대화 재생 플레이어가 표시됩니다. 

    오디오 생성화면
    팟캐스트 변환 완료 화면

    Qwen2.5에 대한 리포트 PDF파일을 입력해서 생성된 팟캐스트를 한번 들어보세요

    "이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

    맺음말

    Open NotebookLM은 누구나 쉽게 PDF 문서를 흥미로운 팟캐스트 형식으로 변환할 수 있는 유용한 도구입니다. 오픈 소스 모델을 기반으로 하기 때문에 접근성이 높으며, 스크립트 지원과 사용자 친화적인 인터페이스를 통해 누구나 손쉽게 사용할 수 있습니다. 앞으로 더욱 다양한 기능과 언어 지원을 통해 발전할 것으로 기대됩니다.

     

    Open NotebookLM을 사용해 본 느낌은 다음과 같습니다.

    • 음성이 좀 더 자연스러우면 좋을 것 같다
    • 한국어 지원과 스크립트 표시기능은 구글 NotebookLM보다 편리하다
    • Llama, Mistral, Phi 등 Fireworks API에서 지원하는 모델로 변경이 가능하다

     

    오늘 블로그를 통해서 PDF를 재미있는 팟캐스트로 변환해 주는 무료도구인  Open NotebookLM을 여러분도 한 번 직접 사용해 보시고, PDF 파일을 팟캐스트로 바꾸는 멋진 경험을 해보시길 바라면서 저는 다음 시간에 더 유익한 정보를 가지고 다시 찾아뵙겠습니다. 감사합니다. 

     

    https://fornewchallenge.tistory.com/

     

     

    2024.10.03 - [AI 도구] - 🤩 PDF 문서가 지루하다면? PDF2AUDIO로 한국어 팟캐스트를 쉽게 만들어보세요!🎧

     

    🤩 PDF 문서가 지루하다면? PDF2AUDIO로 한국어 팟캐스트를 쉽게 만들어보세요!🎧

    안녕하세요! 오늘은 PDF 파일을 흥미진진한 팟캐스트로 변신시켜 줄 PDF2AUDIO라는 도구에 대해 알아보겠습니다. 🪄 구글의 NotebookLM과 유사한 기능을 오픈소스로 구현한 PDF2AUDIO는 OpenAI의 강력한

    fornewchallenge.tistory.com

     

     

    728x90