Co je to složka v počítači?: Vše, co potřebujete vědět o souborovém systému a operačním systému

Poslední aktualizace: 19 ledna 2024
složka, souborový systém

Všichni používáme soubory nebo soubory každý den a všichni ho také používáme složky nebo adresáře, ať už v souborových systémech stolních počítačů, notebooků, mobilních zařízení atd. Proto v tomto článku vysvětlím vše, co o tom potřebujete vědět, abyste tomu porozuměli co jsou informace a jak jsou uloženy na památku.

Co je to souborový systém?

souborový systém

Un souborový systém Souborový systém (FS) je metoda a datová struktura, kterou operační systém používá k řízení ukládání a načítání informací. Bez souborového systému by data uložená na paměťovém médiu byla jedinou datovou entitou, bez možnosti rozlišit, kde jedna datová sada končí a začíná další, nebo kde se jakákoli datová sada nachází, když je třeba ji načíst. Toto by se nazývalo nezpracovaná data.

Když formátujete úložný disk pomocí systémů NTFS, FAT, ext4, btrfs, HFS+ atd., ve skutečnosti vytváříte souborový systém pro správu dat na tomto disku. Jinými slovy, to, čemu říkáme formáty, jsou ve skutečnosti souborové systémy (FS).

Rozdělením dat do bloků a pojmenováním každého bloku, lData lze snadno izolovat a identifikovatAby to vše bylo možné, souborový systém se skládá ze dvou nebo tří vrstev. Někdy jsou tyto vrstvy explicitně oddělené a jindy jsou funkce kombinovány. Vrstvy, o kterých mluvíme, jsou:

  • Logický souborový systém: je zodpovědný za interakci s uživatelskou aplikací. Poskytuje API pro operace se soubory, jako například Otevřít, Zavřít, Číst atd.a přeposílá požadovanou operaci vrstvě pod ní ke zpracování. Logický souborový systém spravuje otevřené položky tabulky souborů a deskriptory souborů pro každý proces. Tato vrstva poskytuje přístup k souborům, operace s adresáři, zabezpečení a ochranu.
  • Virtuální souborový systémToto rozhraní umožňuje podporu pro více souběžných instancí fyzických souborových systémů. Tato vrstva je volitelná a není vždy přítomna.
  • Fyzický souborový systém: Zpracovává fyzický provoz úložného zařízení. Zpracovává fyzické bloky, které jsou čteny nebo zapisovány. Zpracovává ukládání do vyrovnávací paměti, správu paměti a je zodpovědný za fyzické umístění bloků na specifická místa na úložném médiu. Fyzický souborový systém interaguje s ovladači hardwarových zařízení úložiště nebo kanálem a řídí úložné zařízení.

Funkce FS

Každý existující souborový systém má svá omezení a znak které byste měli vědět, jako:

  • Správa nebo alokace prostoru: Souborové systémy alokují prostor granulárně, obvykle mezi více fyzických disků v zařízení. Souborové systémy jsou zodpovědné za organizaci souborů a adresářů a za sledování toho, které oblasti média patří kterým souborům a které jsou nepoužívané.
  • Fragmentace: K tomu dochází, když je stejný soubor uložen na různých místech úložného disku, což znamená, že jednotlivé části souboru nejsou souvislé. Při vytváření, úpravách a mazání souborů mohou vznikat oblasti s použitým a nevyužitým prostorem různé velikosti. Nejen to, ale ovlivňuje to i některé souborové systémy (např. FAT a NTFS od společnosti Microsoft) a zpomaluje čtení souborů.
  • Názvy souborů: Souborové systémy spravují omezení délky, rozlišování velkých a malých písmen a používání speciálních znaků v názvech souborů.
  • Adresáře: Často mají adresáře pro uspořádání souborů do samostatných kolekcí. Mohou být ploché nebo hierarchické. O tom budu podrobněji diskutovat později, protože o to jde...
  • Metadata: Má přidružené informace o metadatech, které zahrnují podrobnosti, jako je délka dat, časová razítka, přístupová oprávnění a atributy souborů.
  • Inženýrské sítě a přístup: Používají se k inicializaci, úpravě a mazání instancí souborového systému, stejně jako k vytváření, přejmenování a mazání adresářů a souborů, šifrování, kvótám, migraci, konverzi, zálohování atd.
  • Integrita a správa chyb: FS musí zachovat integritu struktur souborového systému na sekundárním úložišti nebo externích discích, a to i v případě selhání operačního systému nebo výpadků napájení.
  • Uživatelská data: musí umožňovat správu uživatelských dat, včetně ukládání, načítání a aktualizace dat.
  • Více souborových systémů: Je možné mít na jednom systému více souborových systémů.
  • Omezení designu: Souborové systémy mají funkční omezení, která definují maximální úložnou kapacitu v daném systému, maximální velikost souborů, počet souborů atd.

Co je to oddíl?

A rozdělení Oddíl je logická část nebo pododdíl datového úložného zařízení, jako je HDD, SSD, flash disk atd. Tento oddíl slouží k několika účelům a umožňuje lepší organizaci a správu uložených dat. Například každý oddíl by mohl být použit pro specifický účel, mohlo by na něm být nainstalováno více operačních systémů atd.

Je důležité poznamenat, že vytváření, mazání a změna velikosti Změny oddílů mohou vést ke ztrátě dat, proto je důležité provádět tyto operace opatrně a před provedením zásadních změn ve struktuře oddílů zálohovat důležitá data.

Na druhou stranu, shrnuto, měli byste také pochopit, že existují různé typy příček základní v systému MBR (možnosti jsou v GPT rozšířeny až na 128 možných oddílů na stejné jednotce, i když to je jiné téma…):

  • Primární oddíl: Každá úložná jednotka může mít až čtyři primární oddíly. Jedná se o hlavní oddíly, na kterých jsou nainstalovány operační systémy a kde se nacházejí data. Jeden z primárních oddílů lze označit jako aktivní nebo spouštěcí oddíl, ze kterého se operační systém spouští.
  • Rozšířený oddíl: Rozšířený oddíl je speciální primární oddíl používaný k vytváření dalších logických oddílů. Neobsahuje přímo data, ale funguje jako kontejner pro logické oddíly. V rámci rozšířeného oddílu můžete mít více logických oddílů. To vám umožňuje překonat omezení čtyř primárních oddílů na pevném disku.
  • Logický oddíl: Tyto se vytvářejí v rámci rozšířeného oddílu. Nepoužívají se ke spuštění operačního systému, ale obecně se používají k organizaci dat nebo souborů. V rámci rozšířeného oddílu můžete mít více logických oddílů, což usnadňuje organizaci dat.
  Recuva: Jak obnovit smazané soubory

Co je tabulka oddílů?

La tabulka oddílů Jedná se o datovou strukturu umístěnou na začátku pevného disku a obsahující informace o tom, jak je disk rozdělen na oddíly. Obvykle je uložena v hlavním bootovacím sektoru (MBR) v systémech založených na BIOSu nebo v GPT (tabulka oddílů GUID) v modernějších systémech založených na UEFI. Tabulka oddílů obsahuje podrobnosti, jako je velikost každého oddílu, jeho typ (např. NTFS, FAT32, ext4 atd.) a jeho umístění na paměťovém médiu.

Vztah mezi tabulkou oddílů a souborovým systémem tedy spočívá v tom, že tabulka oddílů indikuje kde každý oddíl začíná a končí na fyzickém disku. Každý oddíl je naformátován se specifickým souborovým systémem. Když je oddíl přístupný za účelem čtení nebo zápisu souborů, operační systém použije informace v tabulce oddílů k nalezení a pochopení struktury souborového systému na daném oddílu.

Typy systému souborů

Formát

Mezi různými souborovými systémy je třeba zdůraznit následující typy:

  • Souborové systémy disků: Tyto systémy využívají schopnosti diskových úložných médií přistupovat k datům náhodně a rychle. Umožňují více uživatelům nebo procesům přistupovat k datům na disku bez ohledu na jeho sekvenční umístění. Mezi příklady patří FAT, exFAT, NTFS, Reiser FS, HFS, HFS+, HPFS, APFS, UFS, ext2, ext3, ext4, XFS, btrfs, VMFS, ZFS, ReiserFS, NSS a ScoutFS. Kromě nich by mohly být zváženy i následující:
    • Optické disky: běžné formáty jako ISO 9660 a Universal Disk Format (UDF) používané na CD, DVD a Blu-ray.
  • Systémy souborů Flash: Tyto systémy jsou navrženy speciálně pro flash paměťová zařízení a berou v úvahu jejich vlastnosti a omezení. Doporučuje se používat souborové systémy určené pro flash paměťová zařízení namísto adaptace diskových systémů. Mezi příklady patří JFFS, JFFS2, YAFFS, UBIFS, LogFS a F2FS.
  • Systémy souborů s magnetickými páskami: Tyto systémy spravují úložiště na páskách, které mají delší dobu náhodného přístupu než disky. Liší se ve správě adresářů a kladou důraz na potřebu vyhnout se častým lineárním přesunům na páskách. Příkladem by mohl být LTFS od IBM.
  • Souborové systémy databází: Souborové systémy založené na databázích, kde jsou soubory identifikovány podle charakteristik, jako je typ, autor nebo metadata. Mezi příklady patří mimo jiné IBM DB2.
  • Transakční souborové systémy: Tyto systémy zaručují atomicitu a izolaci operací se souborem. Mezi příklady patří NTFS v systému Microsoft Windows a další prototypy transakčních souborových systémů pro UNIX/Linux, jako například LFS, ext3 atd.
  • Síťové souborové systémy: Síťové souborové systémy, které umožňují přístup k souborům na vzdálených serverech prostřednictvím protokolů, jako jsou NFS, AFS, SMB, FTP a WebDAV. To znamená, že jsou navrženy pro distribuované výpočty.
  • Sdílené souborové systémy: Tyto systémy umožňují více serverům bezpečný přístup ke stejnému diskovému subsystému. Mezi příklady patří GFS2, GPFS, SFS, CXFS, StorNext a ScoutFS.
  • Speciální souborové systémy: Jsou poněkud specifické a nemají samotné souborové elementy, ale lze k nim přistupovat prostřednictvím API. Například systém souborů zařízení definujeme jako devfs, používaný v Linuxu atd. Na druhou stranu máme další speciální, jako jsou configfs, sysfs a procfs, známé také ve světě Linuxu.
  • Minimální souborový systém / úložiště audiokazet: Audiokazety byly použity jako systémy pro ukládání dat k napájení některých modelů mikropočítačů té doby, jako například Commodore PET.
  • Ploché souborové systémy (plochý souborový systém): Tyto systémy nemají žádné podadresáře a ukládají všechny položky adresáře do jednoho hlavního adresáře. Příklady těchto souborových systémů jsou systém používaný v systému CP/M a souborový systém Macintosh pro klasické počítače Mac od společnosti Apple.

FS Technologies

Proces formátování

Každý souborový systém má svá specifika a ty podporují různé technologie. Některé z nejdůležitějších jsou:

  • Samoléčení: Označuje schopnost souborového systému automaticky detekovat a opravovat chyby a problémy, které mohou v úložném systému nastat. Mezi tyto chyby může patřit chybný sektor na pevném disku nebo jiné typy poškození dat. Pokud je zjištěna chyba, souborový systém se může pokusit obnovit postižená data obnovením ze záloh nebo opravou poškozených dat. To pomáhá zachovat integritu dat uložených v souborovém systému.
  • Komprese: Jedná se o funkci, která umožňuje zmenšit velikost souborů a dat uložených v souborovém systému. Komprese dat může ušetřit místo na disku a urychlit přenos souborů. Pokud je komprese povolena, souborový systém automaticky komprimuje soubory, které se do něj zapisují, a dekomprimuje je při čtení. To může být užitečné u úložných systémů s omezenými zdroji, i když to může zpomalit přístup.
  • šifrování: Jedná se o techniku ​​používanou k ochraně důvěrnosti dat uložených v souborovém systému. Data jsou před zápisem na disk šifrována a při čtení dešifrována. Šifrování zajišťuje, že data jsou nečitelná pro kohokoli bez příslušného dešifrovacího klíče. To je nezbytné pro ochranu soukromí a zabezpečení citlivých dat. Stejně jako komprese může také zpomalit přístup.
  • Záznam do deníku (transakční protokol): Jedná se o funkci, která uchovává záznamy o všech operacích provedených v souborovém systému, jako je vytváření, úprava nebo mazání souborů. Tento záznam se nazývá „deník“ nebo „transakční protokol“. V případě selhání systému, například neočekávaného výpadku napájení, může souborový systém použít transakční protokol k obnovení do konzistentního stavu. Tím se zabrání poškození dat a zajistí se integrita souborového systému.
  • Kapacita snímků: Snapshoty jsou kopie souborového systému v určitém časovém bodě. Tyto kopie jsou snímky a jsou uloženy společně s aktuálními daty v souborovém systému. Snapshoty umožňují obnovení souborového systému do předchozího stavu, pokud dojde k chybám nebo nežádoucím změnám. To je užitečné pro zálohování, obnovu dat a testování změn před jejich trvalou implementací v systému.
  Nejkatastrofálnější a nejpalčivější selhání v historii informatiky

Co je to adresář nebo složka?

Windows 10, složka bez přístupu

Nyní, když víme, jak jsou data ukládána v paměťových jednotkách a jaké jsou potřebné datové struktury, je čas přejít k vysvětlení, co a složka nebo adresář.

Adresář nebo složka je struktura pro katalogizaci dalších souborů v rámci souborového systému, což mu dává intuitivnější hierarchii nebo organizaci pro uživatele nebo operační systém. Za tímto účelem obsahuje odkazy na jiné soubory a případně i na jiné adresáře nebo složky, v tomto případě nazývané podadresáře nebo podsložky.

Některé operační systémy s hierarchickými souborovými systémy, jako například Unix, mají obvykle mezipaměť adresářů s posledními cestami uloženými v části paměti RAM. V Unixu je tato část známá jako DNLC (Directory Name Lookup Cache), zatímco v Linuxu se nazývá dcache. Tato část paměti je aktualizována o naposledy přístupné cesty, zatímco v síťových souborových systémech je vyžadován mechanismus pro zajištění konzistence správou položek, které byly zneplatněny nebo vytvořeny uživateli.

V jednom hierarchický souborový systém Úložiště je stromové. Pojmy „rodič“ a „dítě“ se často používají k popisu vztahu mezi podadresářem a adresářem, ve kterém je katalogizován, přičemž druhý jmenovaný je rodičovský. Nejvýše postavený adresář v takovém souborovém systému, který nemá vlastního rodiče, se nazývá kořenový adresář. To lze nejlépe vidět v Unixu nebo Linuxu, kde máte určitou hierarchii a kořenový adresář je root nebo /, ze kterého visí všechny ostatní adresáře, i když nejsou na stejném oddílu.

Virtuální adresář je typ organizace souborů, který se nespoléhá na umístění v hierarchickém adresářovém stromu. Místo toho shromažďuje výsledky ze zdroje dat, jako je databáze nebo vlastní index, a vizuálně je prezentuje ve stejném formátu jako zobrazení složek.

Tyto složky nebo adresáře lze spravovat pomocí nástrojů, a to jak grafického uživatelského rozhraní (GUI), tak i rozhraní příkazového řádku (CLI). Například můžeme použít příkazy nebo samotný správce souborů k vytváření, mazání, přejmenování, přesouvání, kopírování atd. I když některé operační systémy mohou mít určitá omezení týkající se oprávnění a akcí, které můžete provádět s určitými složkami...

Podrobnosti o složce nebo adresáři v různých operačních systémech

V každém souborový systém a operační systém, soubory a složky jsou zacházeny odlišně:

  • Vykořenit: Toto je bod, od kterého visí nebo kde se nachází zbytek hierarchie složek systému. Ve Windows je to obvykle C:\, zatímco v Unixu/Linuxu je to kořenový oddíl nebo /.
  • Cesta nebo trasaToto je cesta, kde se nachází složka nebo soubor v souborovém systému (FS). Například ve Windows to může být C:\Program Files\Office\Word.exe. V Unixu/Linuxu by to bylo něco jako /home/user/example.c. Jak vidíme, ve Windows se používá zpětné lomítko, zatímco ve světě *nix se používá tradiční lomítko.
  • Název souboru nebo název souboru: Toto je název přiřazený každému souboru v rámci konkrétního souborového systému. Každý souborový systém má svá vlastní omezení týkající se maximálního počtu znaků pro název souboru. Dále je třeba rozlišovat mezi základním názvem a příponou. Některé dřívější systémy měly také omezení délky přípon, obvykle tři. Proto se někdy místo .html zobrazí přípona .htm, aby byla zajištěna kompatibilita se systémy DOS. Příkladem názvu souboru může být example.txt, kde „example“ je název a „txt“ je přípona, což v tomto případě znamená, že se jedná o text.
  Zpracování obrazu v počítači: jak software zpracovává tyto typy souborů

Konkrétní případ Unixu/Linuxu

Co je to superblok?

Un superblok Jedná se o základní datovou strukturu, která se nachází na začátku souborového systému. Superblok obsahuje důležité informace o samotném souborovém systému a používá se ke správě a přístupu k datům uloženým v tomto souborovém systému. Každý souborový systém Unix má svůj vlastní superblok a jeho specifický formát se může lišit v závislosti na použitém souborovém systému (např. ext4, XFS, UFS atd.).

La informace, které jsou uloženy v superbloku může zahrnovat:

  • Velikost souborového systému: označuje celkovou velikost souborového systému.
  • Počet inodů: Určuje počet inodů dostupných v souborovém systému. Inody jsou datové struktury, které reprezentují soubory a adresáře.
  • Volné bloky: Zaznamenává počet volných datových bloků zbývajících v souborovém systému pro ukládání informací.
  • Bod připojení: označuje adresář, ve kterém je souborový systém připojen v operačním systému.
  • Identifikace souborového systému: jedinečný identifikátor souborového systému, který jej odlišuje od ostatních souborových systémů ve stejném systému.
  • Datum a čas shromáždění: zaznamenává, kdy byl souborový systém naposledy připojen.
  • Použité čítače inodů a bloků: sleduje, kolik inodů a datových bloků se v souborovém systému používá.
  • Kontrolní součet a další metadata integrity: Některé moderní superbloky mohou obsahovat další informace pro ověření integrity dat uložených v souborovém systému.

Když je souborový systém, tj. formátovaný oddíl, připojen, operační systém přistupuje k superbloku, aby získal důležité informace o struktuře a stavu souborového systému. Tyto informace jsou nezbytné pro čtení a zápis dat do souborového systému a také pro zajištění integrity a konzistence uložených dat.

Inody a adresáře

En Unix/Linux, Všechno je soubor, například oddíly, jednotky zařízení atd. V jiných systémech, jako je Windows, tomu tak není. Pokud je však vše souborem, i složky nebo adresáře jsou považovány za speciální typy souborů.

Adresář je tedy speciální soubor, který obsahuje názvy souborů (a podadresářů) a čísla inodů pro soubory na stejném souborovém systému nebo názvy symbolických odkazů na soubory nebo adresáře na stejných nebo různých souborových systémech. V případě pevných odkazů inode sleduje, kolik položek adresáře je v něm uvedeno, a maže bloky souborů, když počet odkazů dosáhne nuly. V případě měkkého odkazu nebo symbolického odkazu je to jiné. Smazání symbolického odkazu neovlivní cílový soubor. Pokud je však soubor se symbolickými odkazy na něj smazán, odkazy se stanou nepoužitelnými.

V souborových systémech Unix/Linux je soubor může mít několik jmen, s položkou adresáře pro každé jméno ve stejném nebo různých adresářích, přičemž všechny odkazují na stejnou strukturu inodů, která udržuje seznam bloků disku, kde jsou data uložena.

Abychom tomu všemu lépe porozuměli, je důležité si uvědomit, co je inode (indexový uzel). Je to základní datová struktura v souborových systémech *nix. Představuje a ukládá důležité informace v souboru nebo adresáři v rámci souborového systému. Systém proto bude složku i soubor vnímat jako inode.

Aby to bylo možné, každý inode ukazuje na další informace:

  • Číslo inodu: jedinečný identifikátor pro každý soubor nebo adresář.
  • Typ souboru: Označuje, zda inode odkazuje na běžný soubor (f), adresář (d), symbolický odkaz (l) nebo jiný typ souboru.
  • Velikost: aktuální velikost souboru v bajtech.
  • Oprávnění a vlastník: Informace o tom, kdo má oprávnění k přístupu (čtení, zápis, spuštění) a úpravě souboru, a také o vlastníkovi souboru (uživatel nebo root). Vlastníkem může být i uživatel, který jako takový neexistuje, ale může se jednat o zařízení atd.
  • Datum a čas vytvoření/úpravy: Zaznamenává, kdy byl inode poprvé vytvořen a kdy byl naposledy upraven. Mohou být zahrnuta i další metadata nebo rozšířená oprávnění.
  • Počet odkazů: Udává, kolik názvů souborů nebo adresářů je přidruženo k tomuto inodu. Adresáře mají alespoň dva odkazy: jeden na sebe a jeden na svůj nadřazený adresář.
  • Ukazatele na datové bloky: Obsahuje odkazy na datové bloky v úložné jednotce, které ukládají skutečný obsah souboru. Tyto bloky mohou být přímé, nepřímé nebo dvojitě nepřímé adresy v závislosti na konkrétní implementaci souborového systému a velikosti souboru.

Inody jsou klíčové pro fungování souborového systému, protože umožňují operačnímu systému sledovat fyzické umístění a informace spojené s každým souborem a adresářem. Při přístupu k souboru nebo adresáři operační systém konzultuje odpovídající číslo inodu, aby našel umístění dat a dalších informací souvisejících s tímto souborem.