bachelorprosjekt 2025
"KAI-data": Geografisk data og utveksling med Delta Lake og Delta Sharing
Denne readme er generert med chatgpt.
Dette prosjektet består av Jupyter Notebooks utviklet for behandling, filtrering og visualisering av geografiske data (AR50 og AIS). Verktøyene tar i bruk ulike teknologier som GeoPandas, DuckDB og Apache Spark (Databricks).
| Notebook | Datasett |
|---|---|
u1_geopandas.ipynb, u2_geopandas.ipynb, DuckDB.ipynb Databricks.ipynb, Setup_AIS_Databricks.ipynb |
AIS |
Geopandas.ipynb, DuckDB.ipynb Databricks.ipynb, Setup_AR50_Databricks.ipynb |
AR50 |
Installer nødvendige pakker for lokal kjøring:
pip install requirements.txtDatabricks-miljø krever:
- Apache Spark
- Sedona for geodata
- DASK-governance-modul (ved behov)
- Last opp nødvendige filer i mappen
data/raw - Kjør alle celler i rekkefølge
- Resultater og visualiseringer lagres i
data/processedeller vises i kart/Tabell
Er beskrevet i alle notebookene.
Verktøyene inkluderer interaktive kart (Folium) og widgets for brukervennlig datatilgang og filtrering.
Dette prosjektet er utviklet som del av et bachelorprosjekt og distribueres for utdanningsformål.