Vika 4. Vinnsla með gögn Flashcards
Hvað gerir less skipunin?
Sýnir innihald skrár eina síðu í einu.
aflúsari fyrir regex?
regex101.com
Við segjum að strengur passi við (e. matches) reglulega segð ef ?
Strengurinn tilheyrir mengi þeirra strengja sem segðin skilgreinir.
Hreinir stafir (literal characters) ? (regex)
Einfaldasta reglulega segðin er hlutstrengur með stöfum eingöngu. Strengur passar ef hann inniheldur hlutstrenginn.
Einn stafur ? (regex)
Táknið . passar við alla stafi en aðeins nákvæmlega einn staf.
Safn stafa ? (regex)
Með hornklofa má tilgreina mengi af stöfum. Setjum þá stafina í hornklofa: [abc] eða [a-z] til dæmis sem táknar alla lágstafi frá a til z.
Andhverfa safna ? (regex)
Einnig hægt að segja að allt nema tilteknir stafir eigi að passa með ^
Setjum þá ^ fremst inn í hornklofann.
Regluleg segð: t[^e-h]n
Fyrst og aftast í línu ? (regex)
^ þýðir upphaf línu. Athugið að ^ er fyrir utan hornklofann. Þá passar ^[A–Z] við línu sem byrjar á hvaða hástaf sem er í stafrófinu.
$ þýðir endi línu
[0–9]$ passar við línu sem endar á tölustaf.
Ótakmörkuð endurtekning ? (regex)
Táknið * passar við ekkert eða fleiri tilfelli af reglulegu segðinni á undan. Ath: einn bókstafur er regluleg segð. Táknið + passar við eitt eða fleiri tilfelli af reglulegu segðinni á undan.
Takmörkuð endurtekning ? (regex)
Hægt að ákveða tiltekinn fjölda endurtekninga með { }
– a{n} nákvæmlega n endurtekningar af a
– a{n,} a.m.k. n endurtekningar af a
– a{n,m} n til m endurtekningar af a
Hlutsegðir ? (regex)
Til að auðvelda okkur að endurtaka stærri segðir getum við hópað hluta segðarinnar með svigum: ( )
abc* passar við ab, abc, abcc, abccc, …
Hvað eru síur (e. filter)?
Við getum verið með margar pípur og keðjað þær saman, þá kallast pípurnar síur (e. filter).
hvað gerir wc ?
Telur stafi, orð og línur í staðalinntaki.
Valkostir og flögg:
- l til að sjá fjölda lína,
- w til að sjá fjölda orða
- c til að sjá fjölda stafa.
Hvað gerir head?
Sýnir fyrstu línurnar í staðalinntaki.
Valkostir:
- n sýnir fyrstu n línurnar
- cn sýnir fyrstu n bætin
Hvað gerir tail ?
Sýnir öftustu línurnar í staðalinntaki. Virkar svipað og head en hefur -n+n til að sýna allt nema efstu n-1 línuna og -f til að fylgjast með skránni og bæta við línum þegar hún stækkar.
Hvað gerir cut?
cut sían velur einstaka dálka eða orð úr gagnaskrám.
Hvað gerir sort og hvaða flögg virka með sort?
Sort sían raðar línum inntaks í stafrófsröð.
Valmöguleikar eru:
- d raða eftir stafrófsröð
- f há- og lágstafir jafngildir
- n raða eftir tölugildi, ekki sem streng
- r raða í lækkandi röð
- o s1 skrifa úttakið í skránna s1
Hvað gerir Uniq og hvaða flögg virka?
Eyðir út endurteknum línum í inntakinu.
Valmöguleikar:
- c telur fjölda endurtekninga og sýnir
- d sýnir aðeins endurteknar línur
- u sýnir aðeins einstæðar (unique) línur
Hvað er sed ?
ed var upphaflegi Unix ritillinn. Hann vinnur línu fyrir línu, þ.e sýnir aðeins eina línu í einu.
Sed er straum-útgáfa af ed, þ.e straumritill (e. stream editor) sem getur unnið með inntakið á öflugan hátt.
Með sed er hægt að eiga við skrár án þess að breyta innihaldi þeirra beint (þó það sé mögulegt).
sed hefur fjölmargar skipanir en sú algengasta er ?
útskipting (e. substitution): s
Hvað er awk ?
Awk er forritunarmál og er forritanleg sía fyrir texta og tölur. Awk vinnur línu fyrir línu í textaskjali/textastraumi og er aðallega, eins og sed, notað til þess að vinna með og leita að mynstri í texta. Awk leitar að skilgreindu mynstri í texta og framkvæmir svo tilgreinda aðgerð.
Hvað er bc?
bc (basic calculator) er innbyggð reiknivél í skelinni sem býður upp á flest það sem einfaldar reiknivélar geta gert.
Hvað er st ?
st (simple statistics) er forrit í skipanalínunni sem getur reiknað einfalda tölfræði úr skrá eða frá staðalinntaki. Úttakið getur til dæmis verið minnsta og stærsta gildi, meðaltal, miðgildi, staðalfrávik, dreifni o.s.frv. Málskipanin er: st [valkostur/úttak][skrá].