GIS - Föreläsningar 2 Flashcards
Varför ska man ha databaser och DBMS i GIS?
Stora komplexa datamängder.
GIS används ofta i organisationer med många användare.
Krävs en struktur för all data
Förenklar åtkomst och underhåll
Möjliggör snabb/effektiv sökning och analys
Säkerhet
Access-regler
Lagring och arkivering
Vad är en databas?
Strukturerad samlingsdata; åtkomlig på enhetligt sätt
Olika typer; hierarkiska, nätverksobjektsorienterade, relationsdatabaser, objektsrelationella
Vad finns det för problem med databaser?
Tekniken förändras snabbt
Data är långlivat
Datauppbyggnad är en stor investering
Måste klara integrering/överföring av data
Måste ha en konceptuell modell
Vilka egenskaper har en databas?
Strikt struktur
Säkerhet
Effektiva sökningar
Effektiv lagring
Accesshantering
Hybrida system
Separata koordinatfiler + relationsdatabas. Geometriska data i filsystemen och attributdata i en relationsdatabas. Det finns ingen formell standard, några informella.
Integrerade system
Koordinater & attribut & metoder i tabeller. Dvs, objektsrelationella DB
Relationsdatabaser
Data organiseras i tabeller. Tabellerna kan länkas ihop för att uppnå en bra struktur. Det finns regler och restriktioner vid design av databasen.
Består av tabeller. En relation har attribut (kolumner i tabellen). En relation består av en mängd tupler (rader i tabellen).
Regler för relationsdatabaser
Undvik redundans, dvs samma information ska bara lagras en gång. Varje rad måste vara unik.
Bara enskilda värden får lagras i en cell
Undvik funktionella beroenden
Vad är en databashanterare?
Ett program som hanterar databaser och lagrar data på ett effektivt sätt. Låter användaren specificera strukturen för databasen. Låter användare ställa frågor till databasen och hanterar ev. samtidig åtkomst till databasen.
Transaktionskontroll - ACID
Atomicity - Databashanteraren garanterar att antingen ingen eller hela transaktionen utförs.
Consistency - Databasen är korrekt både före och efter transaktionen
Isolation - Ingen transaktion utanför den aktuella, kan se intermediär status i databasen
Durability - När transaktionen slutförs korrekt går den inte att återkalla
Olika sökningar i data
Linjärsökning - Går igenom hela listan från början tills sökt element hittas
Binärsökning - Kräver sorterad lista, t.ex. alfabetisk ordning. Börjar i mitten och kollar om sökt element är > eller < och söker sedan i rätt halva.
Index
Syftet med index är att tillåta binärsökning på flera kolumner i en relationsdatabas.
Innebär att en extra datastruktur måste lagras samt extra arbete vid skapande/editering av data
Är egentligen redundant data. men ökar sökhastigheten.
Objektsrelationella databaser
Mix av relationsdatabas och objektsorienterad databas.
Stödjer utveckling av mer komplexa datatyper, abstrakta datatyper (ex geometrier)
Vad är objektsrelationell lagringsstruktur?
Koordinater, attribut och topologi i tabeller
Tabeller för många vektorskikt lagras tillsammans i samma databassystem, DBMS
Topologiska egenskaper i separata tabeller som kan hantera topologiska relationer inom och mellan vektorskikt
Operationer (metoder) som är gemensamma för klasser av liknande objektstyper (punkter, linjer, polygoner) kan lagras/hanteras
Vad finns det för problem med att lagra geometriska data i en relationsdatabas?
Relationsdatabsen är främst gjort för att lagra text och siffror. Den är inte bra på att lagra komplicerad data som geometrisk data.
Det finns ingen enhetlig standard för hur dessa ska lagras.
Vidare stöjder inte standard SQL geometriska och topologiska frågor.
Spatiala databaser
Objektsrelationella databaser som har speciella datatyper för geometrier (punkt, linje och polygon). Utöver heltal, flyttal och text
Har även inbyggda funktioner för att ställa geometriska och topologiska frågor till databasen (spatialt utvidgad SQL). Exempelvis enkelt att fråga vilka länder som är grannländer till Frankrike.
Objektsorienterade databaser
Är uppbyggda utifrån objektklasser med: attribut och metoder
Tillåter komplexa datatyper, t.ex. geometriska datatyper
Möjliggör användning av egna objektklasser och datatyper
Finns inget vedertaget frågespråk
Vad kan rasteroperationer utföras på?
Local - Cellen
Focal - Grannskapet
Zonal - Enligt en zon
Global - Inom ett raster
Vad är en omklassificering/gruppering?
De ursprungliga cellvärden ersätts med andra värden för att dela upp datamaterialet i ett mindre antal klasser eller grupper, att anpassa data. Detta underlättar vidare analys och tolkning av spatiala mönster
Zonbaserade operationer
Operation som används för att analysera grupper av celler i ett raster, som finns inom en viss zon eller grupp. Grupperna kan t.ex. bestå av:
Definierade polygoner ex. kommuner
Rasterceller med ett gemensamt värde
Definierade “regioner”
Analyserna kan vara matematiska eller statistiska (medelvärde, standardavvikelse, max-, min-värde, summering av attribut eller antal celler som ingår i gruppen etc)
Operationer inom ett raster
Avståndsberäkningar
Längdberäkningar:
Identifiera alla celler som bygger upp en linje
Beräkna avståndet mellan de ordnade cellerna
Längden är summan av de beräknade avstånden mellan cellerna
Multiplicera med cellstorleken
Areaberäkningar:
Beräkna antalet celler i polygonen
Multiplicera antalet med cellstorleken
Notera att detta är en uppskattning och troligtvis en överskattning av arean
Statistiska beräkningar
Buffertzoner:
Avståndsberäkning + omklassning
Kan användas på punkter, linjer och polygoner.
Ex. Vilka områden ligger inom 1 km från en tätort
Grannskapsoperationer
Beräkning av en cells värde styrs av granncellernas värden
Grannskapet- ofta kallat “fönster” - måste definieras
Fönsterstorleken kan vara 3x3, 5x5, 7x7 osv
Fönstret är oftast kvadratiskt
När fönsterstorleken är definierad anges vilken operation som ska utföras inom detta
Resultatet från operationen skrivs in i fokalcellen i ett nytt rasterskikt
Fönstret flyttas över matrisen, kolumn för kolumn och rad för rad:
Kallas filteroperation
Producerar en ram som saknar relevanta värden
Vad kan topografi användas för inom GIS?
För att studera hur terrängen påverkar:
Byggnationskostnader
Transportkostnader
Dränering - översvämningsrisk
Siktfält
Rastermodellen
I en rastermodell delas den yta som ska representeras (t.ex. ett område på jordytan) in i ett rutnät med ett antal lika stora celler (rutor).
Varje ruta tilldelas ett numeriskt värde som motsvarar det attribut som representeras