Extrémě rychlý "load SQL file"
Tak hele, v šest ráno po mně nemůžete chtít kultivovaný titulek, spokojte se i s tímto.
K zálohování nebo přenášení databází mezi více servery se
používá tzv. SQL dump. Jde o textový soubor obsahující popis struktury
i obsahu tabulek ve formě série SQL příkazů. K jeho generování
z příkazové řádky je určen nástroj mysqldump
, na hostingu
se obvykle používá interaktivní phpMyAdmin.
Aplikaci phpMyAdmin lze použít i k obnovení ze zálohy, tj. načtení SQL dumpu. Bohužel se s tím neskutečně párá a proces trvá moc dlouho. Databáze obsahující jen pár tisíc záznamů nelze takto vůbec importovat – to dřív vyprší časový limit běhu PHP skriptu.
Pokusil jsem se kdysi napsat rychlejší importér a povedlo se. Co phpMyAdmin louská dlouhé minuty, zvládne tento za zlomek sekundy. Nástroj jsem nyní začlenil do dibi a používá se takto:
dibi::connect();
dibi::loadFile('dump.sql');
Lze načítat i komprimovaný soubor:
dibi::loadFile('compress.zlib://dump.sql.gz');
Soubor se čte postupně, takže nevadí, když je větší než dostupná paměť.
Metoda vrací počet vykonaných příkazů. V případě chyby vyhodí výjimku. Ještě zdůrazňuji, že je určen pro SQL dump ve formátu, který generují zmíněné nástroje.
Tip: SQL dump generujte se zaškrtnutou volbou „Rozšířené inserty“ (Extended inserts), má to zásadní vliv na rychlost načítání, ať už používáte jakýkoliv importér.
Komentáře
tark #1
Tohleto vypadá doopravdy skvěle, gratuluju ?
enoice #2
Bezvadné ?
(zbytek smazán, dgx)
Tomik #3
Davide, díky moc! dibi se mi líbí čím dál tím více!
Dero #4
Výborné ?
(zbytek smazán, dgx)
illi #5
při
mysqldump
jsou rozšířené inserty defaultní volbou, ne?
teda aspoň mě to s nima generovalo a nedával jsem žádné zvláštní parametry.
Jakub Hejda #6
Tohle je pro mne důvod toho DIBILíka zkusit
(zbytek smazán, amen) – to je nějaký místní pozdrav? ?
karel #7
Musím uznat, že to funguje skutečně výborně. Zkusil jsem import 71MB dumpu a trvalo to zhruba stejně rychle jako z příkazového řádku.
Arcao #8
A co takhle použít perfektní phpMinAdmin Jakuba Vrány? Ten je na to přímo vhodný.
Dundee #9
Tak to Dibi asi také zkusím. Kopírovat rozsáhlejší dumpy do PMA po pár set záznamech mi neuvěřitelně pilo krev :)
Honza #10
Kdyby někdo potřeboval ten sql dump generovat ve skriptu
mm-marek #11
huh tohle jsme potřeboval před měsícem… páral jsem se s tím až hrůza :(
mám se taky něco připsat, abych měl toliko oceňované ohodnocení smazáno? :)
poznámku o pochvale toho že se nette vypustí až ve finále jsem radši smazal :)
šťoura #12
V titulku článku je pravopisná chyba
Honza #13
#12 šťouro, stačí se začíst kousek dál
Peet #14
Proc nebyl pouzit mysqlimport? Je jeste rychlejsi.
RATMex B #15
Ona poznámka „je určen pro SQL dump ve formátu, který generují zmíněné nástroje“ je dosť klúčová. Práve kvôli tomu sa nedá tento import porovnávať s tým, čo robí phpMyAdmin, nakoľko jeho činnosť je ďaleko obsiahlejšia a všeobecnejšia (odstraňovanie komentárov, syntaktická analýza vstupu ako napr. ne-escape-nuté znaky v reťazcoch, syntaktická a sémantická analýza query pred vykonaním, a pod.).
Priznávam, že spôsob akým to vykonáva môže byť neefektívny, ale dibi::loadFile() ho v žiadnom prípade nenahrádza.
Kcko #16
#9 Dundee, A co takhle pres shell?
David Grudl #17
#14 Peete, #16 Kcko je snad zřejmé, že tahle funkce je určena pro případy, kdy není možné jiné utility použít. Což je případ „jen“ 99,99 % hostingů…
#15 RATMexi Be, dá se porovnat velmi dobře: phpMyAdmin svůj vlastní výstup importuje 30 minut, dibi je hotové za 10 sekund (reálná čísla – z přenášení databáze iprotest.cz před pár dny). Nechci žádnou syntaktickou nebo sémantickou analýzu. A mimochodem, ani phpMyAdmin nic takového nedělá. Jen kontroluje, zda v dumpu nejsou volitelně zakázané příkazy USE, DROP apod.
Požadavky na formát SQL dumpu jsou v podstatě jen dva:
RATMex B #18
#17 Davide Grudle, Pravda, porovnanie (koncového stavu) existuje, ale určite existuje aj vstup pre ktorý je výsledok: phpMyAdmin – 30 minút, dibi – import sa nevykonal. Rôzna činnosť obidvoch nástrojov robí porovnanie výsledkov irelevantným.
Len vtedy ak oba nástroje na rovnaký vstup vykonajú tú istú činnosť (importujú resp. neimportujú tie isté údaje) bude mať časové porovnávanie ich behu nejakú výpovednú hodnotu.
David Grudl #19
#18 RATMexi Be, ovšem to nic nemění na tom, že phpMyAdmin je tak neskutečně pomalý proto, že má importovací rutinu špatně napsanou.
Kcko #20
#17 Davide Grudle, Jasne.
Nastesti tedy muj hosting patri do onoho skvostneho 0,01%
Tento článek byl uzavřen. Už není možné k němu přidávat komentáře.