Son yenilənmə: 21 Jan, 2025

Başlıq - Fayl kodlamasını toplu olaraq UTF-8-ə dəyişdirmək: Python, Notepad++ və Əmr Sətiri ilə faylları UTF-8-ə çevirin

Fayl kodlamasını toplu olaraq UTF-8-ə çevirmək - Giriş

Fayl kodlamasını UTF-8-ə çevirmək müxtəlif platformalarda uyğunluq və ardıcıllığı təmin etmək üçün vacibdir. Çoxlu fayllarla işləyərkən hər birini əl ilə çevirmək yorucu ola bilər. Bu bələdçi sizə müxtəlif alətlər və metodlardan istifadə edərək fayl kodlamasını UTF-8 formatına toplu şəkildə səmərəli şəkildə necə dəyişdirmək lazım olduğunu göstərəcək.

Niyə faylları UTF-8-ə çevirmək lazımdır?

UTF-8, bütün Unicode simvollarını dəstəkləyən geniş istifadə olunan bir xarakter kodlamasıdır. Çoxlu sistemlər, tətbiqlər və dillərlə uyğunluğu təmin edir, bu da onu veb inkişafı, proqramlaşdırma və məlumat mübadiləsi üçün üstün seçim edir.

Faylları UTF-8-ə toplu çevirmək üçün alətlər və metodlar

1. Notepad++ istifadə edərək

Notepad++ fayl kodlamasını toplu şəkildə çevirməyə dəstək verən məşhur mətn redaktorudur. Onu necə istifadə edəcəyiniz aşağıdadır:

  1. Notepad++ quraşdırın: Notepad++-i onun rəsmi veb saytından yükləyib quraşdırın.
  2. Faylları açın: File > Open bölməsinə gedin və çevirmək istədiyiniz bütün faylları seçin.
  3. Kodlamanı dəyişdirin: Encoding > Convert to UTF-8 bölməsinə keçin.
  4. Faylları saxlayın: Dəyişiklikləri File > Save All seçərək saxlayın.

2. Python skriptləri istifadə edərək

Kodlaşdırma ilə rahat olsanız, Python toplu çevirmə prosesini avtomatlaşdıra bilər:

import os

input_folder = 'path/to/your/files'
output_folder = 'path/to/output/files'

for filename in os.listdir(input_folder):
    if filename.endswith('.txt'):  # Adjust for your file type
        input_path = os.path.join(input_folder, filename)
        output_path = os.path.join(output_folder, filename)
        
        with open(input_path, 'r', encoding='ISO-8859-1') as infile:
            content = infile.read()
        with open(output_path, 'w', encoding='UTF-8') as outfile:
            outfile.write(content)

print("Batch conversion to UTF-8 completed.")

ISO-8859-1 kodlamasını giriş fayllarınızın kodlaması ilə əvəz edin.

3. Əmr sətiri alətləri istifadə edərək

Linux/Unix üçün:

Faylları toplu şəkildə çevirmək üçün iconv əmrindən istifadə edə bilərsiniz:

for file in *.txt; do
    iconv -f ISO-8859-1 -t UTF-8 "$file" -o "converted_$file"
done

Oxşar bir metod bizim FAQ‑lərimizdə müzakirə olunur, burada iconvfind əmrləri istifadə edilir. Zəhmət olmasa, Windows qovluğunda fayl kodlamalarını Unix‑bənzər alətlər və ya əmrlərlə (məsələn, Cygwin və ya GnuWin32) necə çevirmək olar? başlıqlı FAQ‑yə baxın. Linux‑da isə Cygwin və ya GnuWin32‑ə ehtiyac yoxdur.

Windows üçün:

PowerShell istifadə edin:

Get-ChildItem -Path "C:\path\to\files\*.txt" | ForEach-Object {
    $content = Get-Content $_.FullName
    Set-Content -Path "C:\path\to\output\$($_.Name)" -Value $content -Encoding UTF8
}

Windows qovluğunda fayl kodlamalarını Unix‑bənzər alətlər və ya əmrlərlə çevirmək istəyirsinizsə, zəhmət olmasa FAQ‑lərimizə baxın.

4. Onlayn alətlərdən istifadə edərək

Bir neçə onlayn alət faylları yükləyib UTF-8-ə çevirməyə imkan verir. Lakin məxfi məlumatlar üçün məxfilik narahatlıqları səbəbindən bunlar uyğun olmaya bilər.

Ən Yaxşı Təcrübələr

  • Faylların ehtiyat nüsxəsini yaradın: Toplu əməliyyatlar aparmazdan əvvəl həmişə ehtiyat nüsxələr yaradın.
  • Kodlamanı yoxlayın: Çevrilmiş faylları iki dəfə yoxlayın ki, proses düzgün işləsin.
  • Versiya nəzarətindən istifadə edin: Layihə üzərində işləyirsinizsə, dəyişikliklərinizi Git kimi versiya nəzarət sisteminə göndərin.

FAQ‑lər

1. Windows qovluğunda fayl kodlamalarını Unix‑bənzər alətlər və ya əmrlərlə (məsələn, Cygwin və ya GnuWin32) necə çevirmək olar?

Bir qovluqdakı bir neçə faylın kodlamasını (məsələn, ANSI‑dən UTF-8‑ə) çevirmək üçün redaktorla əl ilə redaktə etmək qeyri‑praktiqdir. iconv, dos2unixunix2dos kimi utilitləri təmin edən Cygwin və ya GnuWin32 kimi alətlər bu işlər üçün mükəmməldir. Bu alətlər Unix/Linux əmrlərinin Windows sistemində işləməsinə imkan verir və toplu fayl çevirmə kimi tapşırıqları çox asanlaşdırır.

Cygwin və GnuWin32 nədir?

  • Cygwin: Windows‑da Unix‑bənzər mühit təmin edən geniş platformadır. POSIX‑uyğun təbəqə vasitəsilə Unix/Linux tətbiqləri və əmrləri Windows‑da işləyə bilir. Fayl kodlaması çevirmələri, skript yazma və paket idarəçiliyi kimi müxtəlif Unix/Linux əməliyyatlarını yerinə yetirmək istəyən istifadəçilər üçün Cygwin ideal seçimdir.
  • GnuWin32: Populyar Unix/Linux alətləri üçün müstəqil Windows‑yerli ikili fayllar təqdim edən yüngül alternativdir. Cygwin‑dən fərqli olaraq GnuWin32 Unix‑bənzər mühit yaratmır, ancaq iconvdos2unix kimi konkret alətlərə yönəlir. Tam Unix təcrübəsi tələb etmədən sadə tapşırıqlar üçün əla seçimdir.

iconv‑dan kodlama çevirməsi üçün necə istifadə etmək

  • Tək fayl çevirməsi:
    windows-1252 (tez-tez ANSI kimi adlandırılan) faylını UTF-8‑ə çevirmək üçün:

    iconv -f windows-1252 -t utf-8 infile > outfile
    
    • -f windows-1252: Mənbə kodlamasını göstərir.
    • -t utf-8: Hədəf kodlamasını göstərir.
    • infileoutfile: Giriş və çıxış fayl yolları.
  • Bütün .txt fayllar üçün toplu çevirmə: find əmrini istifadə edərək bütün .txt faylları tapın və işlədin:

    find . -name '*.txt' -exec iconv --verbose -f windows-1252 -t utf-8 -o {} {} \;
    

Əhəmiyyətli Qeydlər

  • Bu əmrlər orijinal faylları üzərinə yazır. Lazım gələrsə, məlumatlarınızı ehtiyat nüsxə alın.
  • Ehtiyaclarınıza uyğun aləti seçin:
    • Cygwin‑i tam Unix‑bənzər mühit və inkişaf etmiş skriptlər üçün istifadə edin.
    • GnuWin32‑u yüngül və konkret alət‑əsaslı tapşırıqlar üçün istifadə edin.

Nəticə

Fayl kodlamasını UTF-8-ə toplu dəyişdirmək çətin bir iş olmaq məcburiyyətində deyil. Notepad++, Python və əmr sətiri alətləri kimi vasitələrlə prosesi sadələşdirə və dəyərli vaxt qazana bilərsiniz. İş axınıınıza ən uyğun metodu seçin və ardıcıl fayl kodlamasının faydalarından yararlanın.

Baxın