Introduktion till GIS Flashcards
Vad är Topologi?
In GIS, topology is the term used to describe the geometric characteristics of objects which do not change under transformations such as stretching or bending and are independent of any coordinate system. The topological characteristics of an object are also independent of scale of measurement.
Topology, as it relates to spatial data, consists of three elements: adjacency, containment and connectivity. Adjacency and containment describe the geometric relationships that exist between area features. Areas can be described as being ‘adjacent’ when they share a common boundary. For example, the ski slopes and car parks in Happy Valley may be adjacent. Containment is an extension of the adjacency theme and describes area features that may be wholly contained within another area feature such as an island within a lake. Connectivity is a geometric property used to describe the linkages between line features. Roads are usually connected together to form a road network through which traffic can flow.
Q such as: What is the shortest route from A to B?’ or ‘How many ski slopes lie within or are next to zones of high avalanche risk?’
Mer allmänt är topologi studiet av hur saker hänger ihop, utan att ta hänsyn till avstånd eller form (vilket är vad geometri bryr sig om). Tunnelbanekartor: vilka linjer, stationer, var byta, dock inte tex avstånd mellan stationer
Vad är skillnaden på skalorna ordinal, nominal, intervall och ratio?
On a nominal scale numbers are used to establish identity. In Happy Valley, numbers on a nominal scale include telephone numbers or ski pass codes. These numbers cannot be processed in a mathematical sense, since they do not represent order or relative value. Adding, subtracting or dividing numbers on a nominal scale will not produce a useful result. Adding together two phone numbers is possible, but the answer is meaningless.
The numbers in an ordinal scale establish order. Location in a ski lift queue is an example. In Happy Valley, the ordinal scale is used to publish the top 10 cafés and ski runs based on the number of people using them each week. Using an ordinal scale you can obtain an impression of the order of numbers, but no information about relative sizes. The most popular ski run (ranked 1) is not necessarily twice as popular as the ski run which is ranked second. Arithmetic operations, whilst possible on ordinal data, will again give meaningless results.
On an interval scale the difference between numbers is meaningful but the scale does not have a real origin. Temperatures, in degrees Celsius, are a good example of data that are collected using an interval scale. On a temperature scale it is possible to say that there is a 10- degree difference between a thermometer that records a value of 10 degrees and one that records a value of 20 degrees. Thus, differences can be calculated. However, it would be incorrect to say that 20 degrees is twice as warm as 10 degrees, because zero degrees on the Celsius scale is not a true zero. There is still a temperature when the thermometer reads zero! Negative numbers are also possible on an interval scale.
On a ratio scale measurements can have an absolute or real zero, and the difference between the numbers is significant. Snow depth is an example. It is impossible to have a negative value for snow depth. However, something is known about relationships between data, for example a snow pack that is 3 m deep is twice as deep as one that is 1.5 m deep.
Vad är “scale of measurement” och varför är det viktigt?
The character of attribute data themselves can influence the utility of data sets in GIS analysis. One characteristic which is of considerable importance is the scale of measurement used to record and report the data. For example, every year the managers of Happy Valley must complete a table for a ski resort guide. For this table they need to provide the name of the ski area, its ranking (1st, 2nd, 3rd, 4th largest in the country), its average winter temperature and the size of the ski area. Each item of data uses a dif- ferent scale of measurement. The names given to these scales are nominal, ordinal, interval and ratio.
Vad är några av problemen med användningen av flygfotografi i GIS?
Before any aerial photograph information can be used in a GIS a number of factors must be considered.
The first of these is scale. Scale varies across an aerial photograph, owing to the distance of the camera from the ground. The scale will be constant only at the centre of the image, and the greater the flying height, the greater the scale difference between the centre and edges of the image. This will also affect the angle of view towards the edge of the image creating the effect whereby tall vertical features such as mountains, buildings and trees appear to lean away from the centre of the image or the ‘nadir’ (that point that is vertically beneath the camera).
Second, factors that may influence interpretation need to be considered. These include time of day and time of year. Väder, snötäcke etc.
Any source of spatial data may be influenced by some, or all, of the following 8 factors:
Varför är det viktigt?
- the purpose for which they have been collated;
- the scale at which they have been created;
- the resolution at which they have been captured;
- the projection which has been used to map them;
- the spatial referencing system used as a locational framework;
- the nature of the spatial entities used to represent real-world features;
- the generality with which these entities have been modelled;
- the topological structure used to represent the relationship between entities.
Appreciating the main characteristics of spatial data is important because these characteristics will determine how the data can be used in building a GIS model. For example, data collected at different resolutions should only be integrated and analyzed at the resolution of the coarsest data set. In the Zdarske Vrchy case study the 30 m by 30 m resolution of the land use map gener- ated from TM satellite data dictated the resolution of the database for analysis. Therefore, GIS models are only as good a repre- sentation of the real world as the spatial data used to construct them.
Vad är MAUP?
Modifiable areal unit problem är en källa till statistisk partiskhet som radikalt kan påverka resultaten av statistiska hypotestest. Det påverkar resultat när punktbaserade mått på rumsliga fenomen (t.ex. befolkningstäthet ) aggregeras i distrikt. De resulterande summariska värden (t ex summor, priser, proportioner) påverkas av valet av områdesgränser. Till exempel kan censusdata aggregeras till folkräkningen uppräkningsdistrikt eller postnummerområden , eller polis polisdistrikt, eller någon annan fysisk partition (alltså, “areal enheterna” är “modifierbara”).
Hur beräknas Euclidean distance? (komplettera)
Euclidean distance is calculated from the center of the source cell to the center of each of the surrounding cells.
The Euclidean distance output raster contains the measured distance from every cell to the nearest source. The distances are measured as the crow flies (Euclidean distance) in the projection units of the raster, such as feet or meters, and are computed from cell center to cell center.
The Euclidean Distance tool is used frequently as a stand-alone tool for applications, such as finding the nearest hospital for an emergency helicopter flight. Alternatively, this tool can be used when creating a suitability map, when data representing the distance from a certain object is needed.
What are the limitations of Euclidean distance?
The Euclidean distance tools give you information according to Euclidean, or straight-line, distance. It may not be possible to travel in a straight line to a specific location; you may have to avoid obstacles such as a river or a steep slope. In such cases, you should consider using the Cost distance tools to achieve more realistic results.
Vad kan man göra med euclidean distance?
Man kan bestämma hur långt varje cell är från närmaste källa. Källan kan vara vad som helst, tex en väg, och kan vara i både raster och feature format.
Du kan också bestämma riktningen från varje cells centrum till närmaste källa med valmöjligheten att skapa avståndsoutput.
Vad är cost distance analysis?
Ge exempel
Från cellperspektivet är syftet med kostnadsverktygen att bestämma den minst kostsamma vägen att nå en källa för varje cellposition i Analysfönstret. The least accumulative cost path to a source, the source that allows for the least-cost path, and the least-cost path itself must be determined for each cell. Kostnadsdistansverktyg liknar euklidiska verktyg, men i stället för att beräkna det verkliga avståndet från en plats till en annan, bestämmer kostnadsdistansverktyg kortaste viktade avståndet (eller ackumulerad resekostnader) från varje cell till närmaste källplatsen.
Dessa verktyg gäller avstånd i kostnadsenheter, inte i geografiska enheter. Alla kostnader avståndsverktyg kräver både en källa dataset och en kostnad raster som indata
Exempel:
Används tex vid konstruktion av väg där pris per meter kan anges i kostnadsraster. För att skapa vägen måste cost distance surface skapas (alltså ytan av vägen vilket kan vara fler än en cell) –> för detta behövs ett locations dataset och konstadsrastret.
A cost raster identifies the cost of traveling through each cell. To create this raster, you need to identify the cost of constructing a road through each cell. Although the cost raster is a single dataset, it is often used to represent several criteria. In this example, land use and slope influence the construction costs. Each of these datasets is in a different measurement system (land-use type and percent slope), so they cannot be directly compared to one another and must be reclassified to a common scale.
Vad är Interpolation?
Interpolation predicts values for cells in a raster from a limited number of sample data points. It can be used to predict unknown values for any geographic point data, such as elevation, rainfall, chemical concentrations, and noise levels.
Interpolation förutspår värden för celler i ett raster från ett begränsat antal provdatapunkter. Interpolation kan användas för att förutsäga okända värden för vilken geografisk punktdata som helst: exempelvis höjd, nederbörd, kemiska koncentrationer, och bullernivåer.
Redogör för de olika metoderna för interpolering
- The IDW (Inverse Distance Weighted) tool uses a method of interpolation that estimates cell values by averaging the values of sample data points in the neighborhood of each processing cell. The closer a point is to the center of the cell being estimated, the more influence, or weight, it has in the averaging process.
- Kriging is an advanced geostatistical procedure that generates an estimated surface from a scattered set of points with z-values. More so than other interpolation methods, a thorough investigation of the spatial behavior of the phenomenon represented by the z-values should be done before you select the best estimation method for generating the output surface.
- Natural Neighbor interpolation finds the closest subset of input samples to a query point and applies weights to them based on proportionate areas to interpolate a value (Sibson, 1981). It is also known as Sibson or “area-stealing” interpolation.
((•The Spline tool uses an interpolation method that estimates values using a mathematical function that minimizes overall surface curvature, resulting in a smooth surface that passes exactly through the input points.
• The Spline with Barriers tool uses a method similar to the technique used in the Spline tool, with the major difference being that this tool honors discontinuities encoded in both the input barriers and the input point data.
• The Topo to Raster and Topo to Raster by File tools use an interpolation technique specifically designed to create a surface that more closely represents a natural drainage surface and better preserves both ridgelines and stream networks from input contour data.
The algorithm used is based on that of ANUDEM, developed by Hutchinson et al at the Australian National University.
• Trend is a global polynomial interpolation that fits a smooth surface defined by a mathematical function (a polynomial) to the input sample points. The trend surface changes gradually and captures coarse-scale patterns in the data.))
Du har blivit ombedd att skapa en databas med tre kolumner innehållande a) namnen på Europas länder b) deras invånarantal och c) deras storlek i kvadratkilometer. Vilken datatyp ska du specificera för respektive kolumn?
För var och en av kolumnerna i databasen bör du specificera följande dataformat:
a) namnen på Europas länder: Text (namn på länder = text)
b) deras invånarantal: Long integer (heltal större än 32767)
c) deras storlek i kvadratkilometer: Float or Long integer (beroende på mätningarnas precision)
Vad behövs för att skapa en koppling (“join”) mellan två relationella databaser (tabeller) i t ex ArcGIS? Fungerar “Join” i ArcGIS för alla typer av relationer mellan databaser?
För att två relationella databaser eller tabeller ska kunna kopplas (“join”) krävs ett gemensamt nyckelfält. Nyckelfältet är en kolumn som finns i båda tabellerna och som har identiska värden.
“Join” i ArcGIS är ett exempel på en databaskoppling som bara kan hantera en-till-en (one-to-one) och många-till-en (many-to-one) relationer mellan tabeller. För att skapa en koppling för en-till-många eller många-till-många används i ArcGIS funktionen relate.
NUTS3-databasen (attributtabellen) innehåller kolumnerna ‘POPULATION’ (antal invånare) och ‘SQKM’ (landets yta i kvadratkilometer). Skriv ett SQL-uttryck för att få fram följande data:
Följande SQL-uttryck ger dig alla regioner med ett invånarantal större än 1 miljon OCH en yta på EXAKT ett tusen kvadratkilometer:
“POPULATION” > 1000 000 AND “SQKM” = 1000
Varför valde vi “Nearest neighbour” som omsamplings metod vid rektifieringen av kartbilden i övningen?
Kartbilden innehåller diskret information (t ex text och jordartsklasser) som skulle ha blivit förstörd/”utsuddad” om någon av de andra metoderna hade använts. “Nearest neighbor” “flyttar” värden men räknar inte fram nya värden. Både “bilinear interpolation” och “cubic convolution” räknar ut nya värden och används för kontinuerlig data men inte för diskret data.
Innan du konverterade vektorfilen med jordarter till rasterformat ombads du att skapa ett numeriskt index för klasserna i vektorfilen (i “Id” kolumnen”. Förklara varför det här steget var nödvändigt (eller underlättade arbetet).
I ett raster representeras klasser numeriskt (varje klass motsvaras av en siffra). Genom att skapa ett numeriskt index för klasserna i vektorfilen kan du som användare bestämma vilken klass som får vilket värde efter konverteringen till raster. Om du inte hade skapat ett numeriskt index och istället använt “Soil type” (namn) som Value field vid konverteringen till raster så hade ArcMap tilldelat varje klass ett värde som du inte hade kunnat styra över.
Förklara varför det är viktigt att din rumsliga datafil (t ex shape-fil) och din Data Frame i ArcMap har samma koordinatsystem när du ritar (digitaliserar) ny vectordata.
Om din shapefil och din Data Frame har olika och inkompatibla koordinatsystem kan det i vissa fall göra att det du digitaliserar hamnar på fel ställe i världen.
Vilken omsamplingsmetod är lämpling för följande data (motivera dina svar):
a) en vegetationskarta med 20 klasser?
b) ett raster som visar luftförorening (0.5 - 1.13 ppm), framställt genom interpolering av värden från mätstationer?
a) Nearest neighbour för att det rör sig om diskret data.
b) “Bilinear interpolation” eller “Cubic convolution” eftersom det rör sig om kontinuerliga data.
I övning 4 använde du dig av funktionen “Euclidean Distance” för att beräkna avstånd i en rasterfil med upplösningen 500 m. Vore det möjligt att få fram ett avstånd på 1600 m (med precision) med hjälp av den här metoden och det rastret? Motivera ditt svar.
Man kan säga att precisionen när man mäter avstånd med “Euclidean Distance” i ett raser är lika med cellstorleken. För ett raster med upplösningen 500 m får man avståndsmätningar med en precision på 500m. Lodrätt och vågrätt i rastret får man värder med jämna 500 m intervall, på diagonalerna andra värden. Det går inte att med precision mäta upp avståndet 1600 m i ett raster med upplösningen 500m.
Vad är skillnaderna i egenskaper mellan raster- och vektordata?
VEKTOR:
+ bättre för diskreta objekt, ex tallskog har en avgränsad del. Åker/skog osv.
+ enklare att visualisera
+ information attributes kan knytas an till specifika objekt
- Kräver högre dataprestanda
- Stora vektorfiler kräver mycket plats att spara data på.
Vektorer är koordinatbaserade objekt som utgör kartografiska representationer av verkligheten. Vektorer kan vara punkter, linjer eller ytor (polygoner).
Punkter - Positionen för varje punkt eller nod i ett vektorobjekt defineras av ett koordinatpar (x, y). Vektorpunkterna har ofta attribute knytna till sig, ex en punkt kan representera en rastplats vid en väg.
Linjer – kan ex representera vägar. Består av punkter som är sammanknutna.
Polygoner – sjöar är bra att representera med ytor/polygoner.
Vektorobjekten har ofta attribut knutna till sig. Linje- och polygon-vektorerna byggs upp av ett antal noder, medans punkterna är punkter (:)).
RASTER:
+ bättre för kontinuerlig data
+ snabbare analyser
- Kan se kantigt och fult ut
- Hög upplösning kräver mycket plats att spara data på.
Rasterbilder kan utgöra precis vad som helst, ex jpeg. I ArcGIS hamnar koordinaterna i mitten på varje pixel. Pixelstorleken är alltid känd och kan inte ändras för en enskild pixel.
Varje cell/pixel har ett värde har ett numeriskt värde som har en enskild rad i attribute table, snarare än varje enskild pixel som i vektorformat.
Pixelstorleken = den rumsliga upplösningen.
Alla värden (pixelklasser)har ett numeriskt värde antingen float eller integer.
Upplösningen beror på hur stort område en pixel täcker och därmed generaliserar.
Vad är skillnaden mellan cylindrisk-, konisk- och azimutal projektion?
En cylinder tangerar ekvatorn (man får då en projektion av normal typ; dvs i vertikalled (–)), eller längs en medelmeridian (projektionen är då av transversal typ).
Vid konisk projektion tangeras jordklotet av en kon, oftast längs en parallellcirkel. Projektionen sägs då vara av normal typ:
Vid azimutal kartprojektion tangerar ett plan jordklotet i en punkt. Normal typ, när tangeringspunkten är en av polerna, kallas oftast polär aspekt. Transversal typ, om tangeringspunkten ligger på ekvatorn, kallas oftast ekvatoriell aspekt. Även snedaxlig typ används. Bilden visar polär aspekt: