Formatas CSV arba Kur įdėti kableliais?

Kompiuteriai

Tarp taikomų problemų, su kuriomis susiduriajei ne programuotojas, tada pažengęs vartotojas, importuojant duomenis iš vienos programos į kitą nėra taip reti. Ir gana dažnai būtina importuoti lentelių duomenis, kurių iš tikrųjų buvo išrastas CSV formatas. Dabar buvo sukurta keletas alternatyvių sprendimų (tarp jų - XML). Tačiau tam tikrais atvejais CSV failo kūrimas išlieka pats patogiausias sprendimas, o kai kurie - labiausiai probleminiai.

CSV formatas

Formato pavadinimas yra iššifruojamas kaip pakeistos vertės, atskirtos kableliais. "Notepad" failas atrodo taip:

00, 01, 02, 03;

01, 15, 34, 11;

16, 27, 33, 06 (pačioje pabaigoje ženklas nebūtinas)

"Excel" skaičiuoklėje arba panaši programa jau yra tokia:

00010203
01153411
16273306

Bet dabar mes analizavome paprastą atvejį. Problemos prasideda būtent todėl, kad dėl labai suspausto duomenų pateikimo CSV formatas naudojamas perduoti didelį kiekį informacijos. Dažniausiai duomenų bazėse yra skirtingų verčių: skaitmeninis, abėcėlinis, abėcėlinis, su tarpeliais ir tt Dažnai didelėse masyvose yra klaidų, o jei, pavyzdžiui, kažkur iš vienos iš laukų atsiranda papildoma kablelis, visos ląstelės gali pereiti prie vieno.

CSV failo formatas

Apskritai problemas, iškylančias importuojant duomenis CSV failo formatu, galima suskirstyti į tris kategorijas:

1 - Neteisingas lauko užpildymas.

2 - Neteisingas duomenų konvertavimas išsaugant failą CSV.

3 - Neteisingas formato atpažinimas pagal importo programą.

Pirmoji byla jau buvo išnagrinėta iš dalies. Kovoti su problema, turite pateikti duomenų, įvestų teisingumą stebėjimo priemonėmis. Pavyzdžiui, jei jums reikia rinkti adresų pašto sąrašo duomenų bazę, yra specialios scenarijus, kad patikrinti, ar asmuo įrašytas į elektroninį paštą tinkamo formato. Ten, kur yra spragos, kablelių ir bet kokie kiti duomenys, kurie gali būti perskaityti negerai, iš lauko turinys turi būti kabutėse (vadinamasis kompiuterį ").

Antrasis atvejis yra susijęs su kodavimo pasirinkimu. Reikia išsiaiškinti, dažnai patiria kas kodavimas nori importuoti programą. Windows dažniausiai naudojami 1251, todėl, jei originalus failas bus patenkinti tekstą Unicode, atlikite jis bus rodomas paskirties prašymą kaip klausimų grandinėje. Excel, kuriuos galite išsaugoti CSV formatu su skirtingais kodavimo ir skyriklis (išskyrus dar taško naudojimo skirtuką, kabliataškiu), bet tai yra geriausias būdas sukurti failą Notepad ++ arba OpenOfficeCalc.

Trečioji byla yra antrosios pasekmės. Istoriškai CSV formate nėra vieno standarto. Daugelis programų priima ir CSV failus, skirtus TSV (skirtukų atskyrimas) ir SCSV (kabliataškis) skirtumų, ypač dėl to, kad failo plėtinys apie tai nepraneša. Šiuo atveju duomenys skaitomi klaidingai ir nepaskirstomi ląstelėse norima tvarka. Geriausias patarimas yra sukurti CSV failą savo ranka. Kaip jau minėta, jums reikia naudoti patogų redaktorių.

CSV formatas

Yra žinomi gudrybės, kaip sugadinti CSV formatąprogramuotojai. Pakanka, kad paprastas vartotojas laikytųsi mūsų rekomendacijų, kaip kurti failą. Mažiausia problema atsiranda, kai failas yra specialiai sukurtas importuoti į konkrečią programą (tai taip pat vyksta kitaip). Lengviau atsižvelgti į visas galimas problemas, kylančias duomenų perdavimo būdais.