Dlaczego Notatki głosowe Apple nie mają wbudowanej transkrypcji?
Aplikacja Notatki głosowe Apple tylko nagrywa dźwięk. To wszystko. Nie ma funkcji transkrypcji. W przeciwieństwie do dyktowania w czasie rzeczywistym (które zamienia mowę na tekst podczas mówienia), Notatki głosowe po prostu tworzą plik audio i go przechowują. Jeśli chcesz uzyskać tekst z nagrania, potrzebujesz osobnego narzędzia.
To myli wielu użytkowników iPhone'ów. Apple oferuje dyktowanie w czasie rzeczywistym przez Siri, dostępne w każdym polu tekstowym od iOS 16. Ale to służy do pisania, a nie transkrybowania istniejących nagrań. Nie możesz skierować funkcji dyktowania na zapisaną notatkę głosową i otrzymać tekst.
Apple Intelligence, wprowadzone w iOS 18, dodało transkrypcję nagrań rozmów telefonicznych. Ale nadal nie transkrybuje Notatek głosowych. Luka istnieje, a Apple jej nie wypełnił.
Aplikacje innych firm, takie jak Otter.ai (16,99 USD/miesiąc) i Rev (8,33 USD/miesiąc), mogą transkrybować notatki głosowe, ale wymagają pobrania aplikacji i płatnych subskrypcji. Nasze narzędzie jest darmowe, działa w przeglądarce i nie wymaga konta. Prześlij plik M4A, otrzymaj tekst, gotowe.
Jak przetranskrybować notatkę głosową na tekst?
Otwórz aplikację Notatki głosowe na iPhone'ie. Stuknij w nagranie, stuknij Udostępnij, a następnie „Zapisz w Plikach”. Otwórz nasze narzędzie w przeglądarce, prześlij zapisany plik M4A, a sztuczna inteligencja go przetranskrybuje. Zajmuje to około jednej minuty na minutę nagrania.
Notatki głosowe zapisują pliki w formacie M4A (kodek AAC). Nasze narzędzie obsługuje M4A natywnie. Konwersja nie jest potrzebna.
- 1
Otwórz Notatki głosowe
Znajdź nagranie, które chcesz przetranskrybować, w aplikacji Notatki głosowe na swoim iPhonie.
- 2
Udostępnij i zapisz plik
Dotknij nagrania, dotknij menu z trzema kropkami (...), wybierz Udostępnij, a następnie Zapisz w Plikach. Wybierz folder, który łatwo znajdziesz.
- 3
Prześlij i przetranskrybuj
Otwórz speech-to-text.co w Safari (lub innej przeglądarce). Kliknij Prześlij i znajdź plik, który właśnie zapisałeś. Poczekaj, aż AI przetworzy plik. Skopiuj tekst lub pobierz jako TXT, SRT lub VTT.
Jakie ustawienia jakości dźwięku powinienem wybrać, aby uzyskać najlepszą transkrypcję?
Notatki głosowe Apple mają dwie opcje jakości: Skompresowane (128 kbps AAC) i Bezstratne. Do celów transkrypcji wystarczy Skompresowane. Whisper AI zapewnia taką samą dokładność w obu ustawieniach. Pliki Bezstratne są około 10 razy większe, bez żadnej korzyści dla transkrypcji.
To szczegół, którego nie wspomina żadna inna strona do transkrypcji, a pozwala zaoszczędzić znaczną ilość miejsca.
Możesz sprawdzić bieżące ustawienie: przejdź do Ustawienia > Notatki głosowe > Jakość dźwięku. Zobaczysz „Skompresowane” lub „Bezstratne”.
Oto dlaczego ustawienie jakości nie ma znaczenia dla transkrypcji: Whisper wewnętrznie przetwarza wszystkie przychodzące dźwięki do 16 kHz mono przed przetwarzaniem. Twoja notatka głosowa nagrana w 44,1 kHz stereo jest i tak konwertowana do 16 kHz mono. Dodatkowe dane w nagraniu Bezstratnym są odrzucane przez AI, zanim nawet rozpocznie rozpoznawanie mowy.
Nagrania Skompresowane zajmują około 1 MB na minutę dźwięku. Nagrania Bezstratne zajmują około 10 MB na minutę. Jeśli nagrywasz notatki głosowe głównie do transkrypcji, wybierz Skompresowane. Pamięć Twojego telefonu Ci podziękuje.
Jak dokładna jest transkrypcja notatek głosowych?
85 do 95 procent dokładności dla wyraźnych nagrań notatek głosowych. Główne czynniki to odległość od mikrofonu, hałas w tle i klarowność mowy. Format pliku prawie nie wpływa na dokładność transkrypcji notatek głosowych, ponieważ zarówno Skompresowane, jak i Bezstratne M4A zawierają więcej niż wystarczającą ilość danych do rozpoznawania mowy.
Większość problemów z dokładnością wynika z warunków nagrania, a nie z narzędzia do transkrypcji. Dobrze nagrana notatka głosowa transkrybuje się niemal idealnie.
Porady dotyczące nagrywania notatek głosowych, które dobrze się transkrybują
- Trzymaj telefon 15-30 cm od ust. Nie przy samych ustach (powoduje zniekształcenia), ale też nie na wyciągnięcie ręki (za cicho).
- Nagrywaj w cichym pomieszczeniu, jeśli to możliwe. Zamknij okna, wyłącz wentylatory lub klimatyzację.
- Mów normalnym tempem. Szybkie mówienie zmniejsza dokładność. Podobnie jak mówienie nienaturalnie wolno.
- Unikaj nagrywania podczas chodzenia. Ruchy ciała tworzą rytmiczny szum, który zakłóca rozpoznawanie mowy.
- Nie szepcz. AI potrzebuje wyraźnego sygnału do pracy.
Czy mogę transkrybować notatki głosowe na Androidzie?
Tak. Dyktafony w systemie Android zapisują pliki w formacie M4A, OGG lub 3GP w zależności od aplikacji. Prześlij dowolny z tych formatów do naszego narzędzia. Proces jest taki sam: udostępnij nagranie z aplikacji dyktafonu, zapisz plik, prześlij go tutaj.
- Domyślnie aplikacja Samsung Voice Recorder zapisuje pliki w formacie M4A. Udostępnij nagranie, zapisz je, a następnie prześlij.
- Aplikacja Google Recorder (na telefonach Pixel) ma wbudowaną funkcję transkrypcji. Działa jednak tylko na urządzeniach Pixel. Jeśli używasz telefonu Samsung, OnePlus lub innego Androida, ta funkcja nie jest dostępna.
- Różne aplikacje do nagrywania w systemie Android zapisują pliki w różnych formatach. Niektóre używają formatu 3GP (starszy format mobilny), inne OGG lub M4A. Nasze narzędzie obsługuje wszystkie te formaty.
Czy moje notatki głosowe są prywatne?
Tak. Notatki głosowe są szyfrowane podczas przesyłania, przetwarzane tylko w pamięci i usuwane natychmiast po wygenerowaniu transkrypcji. Żadne dźwięki nie są przechowywane na naszych serwerach. Nie wymagamy konta ani danych osobowych. Zgodne z RODO.
Ludzie nagrywają w notatkach głosowych różne rzeczy: osobiste przemyślenia, notatki z terapii, pomysły biznesowe, poufne obserwacje. Nasz system usuwa wszystko w momencie, gdy tekst jest gotowy. Nic nie jest przechowywane, logowane ani wykorzystywane do trenowania modeli.