Transcriere și traducere Audio Locală (Teams/Zoom) cu OpenAI Whisper

Situatie

Transcrierile ședințelor (Teams, Zoom, Webex) sau ale tutorialelor video străine consumă timp prețios. Folosirea serviciilor online (Otter.ai, ChatGPT) expune datele confidențiale (NDA, financiare) pe servere terțe si nu fac fata pentru sedinte mai mari.

Soluția: Rularea modelului OpenAI Whisper direct în sistemul de operare, folosind un simplu script Python. Această metodă este ușoară, nu necesită virtualizare și îți permite să:

Transcrii orice ședință în limba română direct într-un fișier text.
Traduci automat în limba engleză orice videoclip sau fișier audio dintr-o limbă străină pe care nu o cunoști.
Păstrezi confidențialitatea 100%, procesarea făcându-se exclusiv pe procesorul (CPU) sau placa video (GPU) a laptopului tău.

Solutie

Pasi de urmat

Instalarea Python (Baza sistemului)

Dacă nu aveți deja Python instalat, acesta este motorul care va rula scripturile AI.

Pe Windows: 1. Descărcați ultima versiune (recomandat Python 3.10 sau 3.11) de pe site-ul oficial: python.org/downloads. 2. Rulați installer-ul. ATENȚIE: Pe primul ecran de instalare, bifați obligatoriu căsuța „Add python.exe to PATH” (jos). Fără această bifă, terminalul nu va recunoaște comenzile. 3. Deschideți un terminal nou (CMD sau PowerShell) și tastați python --version pentru a verifica instalarea.
Pe Mac: Deschideți terminalul și rulați brew install python.

Whisper are nevoie de utilitarul ffmpeg instalat pe sistem pentru a procesa fișierele audio.

Pe Windows: Deschideți PowerShell ca Administrator și rulați: winget install "FFmpeg (Essentials Build)" (După instalare, este posibil să fie necesar un restart al terminalului).
Pe Mac: brew install ffmpeg

Instalarea librăriei Whisper :
Deschideți terminalul/CMD și instalați Whisper direct via pip:

pip install -U openai-whisper setuptools-rust

Scriptul Python pentru Transcriere

Creați un fișier text numit transcriere.py în același folder cu fișierul vostru audio (ex: sedinta.mp3). Adăugați următorul cod: Python

import whisper


print("Se încarcă modelul Whisper...")
# Folosim modelul 'base' pentru viteză. Pentru acuratețe maximă, schimbați în 'medium'
model = whisper.load_model("base")

print("A început transcrierea. Te rog așteaptă...")
# Scriptul detectează limba automat
result = model.transcribe("sedinta.mp3")

# Salvează rezultatul într-un fișier text
with open("rezumat_sedinta.txt", "w", encoding="utf-8") as f:
    f.write(result["text"])

print("Transcriere finalizată! Verifică fișierul rezumat_sedinta.txt.")

Cum se rulează: În terminal, tastați python transcriere.py.

Scriptul Python pentru Traducere (Video străin -> Engleză/Romana)

Dacă aveți un tutorial în japoneză, spaniolă sau germană și vreți să îl înțelegeți, modelul îl poate traduce automat în limba engleză.

Creați un fișier numit traducere.py:

import whisper

print("Se încarcă modelul...")
model = whisper.load_model("base")

print("Se procesează și se traduce fișierul...")
# Parametrul task="translate" forțează traducerea în Engleză
result = model.transcribe("tutorial_strain.mp4", task="translate")

with open("tutorial_tradus_en.txt", "w", encoding="utf-8") as f:
    f.write(result["text"])

print("Traducere finalizată cu succes!")

Tip solutie

Permanent

Follow Us