This is a read only archive of pad.okfn.org. See the
shutdown announcement
for details.
noa-kickoff
Kick-off-Veranstaltung zu "NOA: Nachnutzung von Open-Access-Abbildungen" - siehe https://www.tib.eu/de/service/aktuelles/detail/projekt-von-tib-und-hochschule-hannover-bewilligt-nachnutzung-von-open-access-abbildungen-noa/ ; Hannover, 28.2.2017
11:00-11:30 Willkommen, Vorhaben (Lambert Heller)
11:30-13:00 Ziele und Probleme bei der Bilder-Suche, mit interaktivem Teil (Christian Wartena) --> s.u. Brainstorming 1 & 2 & 3
13:00-13:30 Forschung an der TIB im Bereich Bildanalyse und Content Mining (Julia Struß, Anna Kasprzik)
13:30-14:30 Pause
14:30-15:00 Vorarbeiten, u.a. WikiProject Open Access (Daniel Mietchen)
15:00-16:00 Übersicht Wikimedia-Projekte und Umgangmit Bildern im Wikiversum incl. Interaktive Session Wikimedia (Manu Raster)
16:00 Wrapup, Farewell (Ina Blümel)
Links:
http://noa.wp.hs-hannover.de/search.php projekteigene Datenbank und Suchfunktion
https://www.tib.eu/de/service/aktuelles/detail/projekt-von-tib-und-hochschule-hannover-bewilligt-nachnutzung-von-open-access-abbildungen-noa/ --> Projektseite ToDo
Hindawi Corpus: https://www.hindawi.com/corpus/
Projektantrag, Zwischenberichte, Abschlussberichte (Link)
http://dx.doi.org/10.5281/zenodo.12745
Publikationen/Präsentationen
http://dx.doi.org/10.5281/zenodo.51562
Literatur von, über und für das Projekt: https://www.zotero.org/groups/881096
Lamberts Slides vom ICSTI ITOC Workshop 2016: http://tib.eu/NOAslides2016
Christians Folien https://www.overleaf.com/8203403zthtvnhcpwjm#/29000543/
Ina: Suche in Bildern https://pad.okfn.org/p/noa-bilder
Ina: Labels für das automatische Bilderklassifizieren (aus AV-Portal Projekt) https://pad.okfn.org/p/klassenlabels
Anwesende:
- Lambert Heller
- Jean Charbonnier (jean.charbonnier@hs-hannover.de)
- Maximilan Zubke
- Christian Wartena
- Daniel Mietchen
- Ina Blümel
- Julia Struß
- Johannes Köpcke
- Frieda Josi
- Ralph Ewerth
- Anna Kasprzik
- Motivation
- alte PowerPoint-Presentation von Lambert
- SpringerImages
- Vortrag Christian Wartena (Textmining)
- Brainstorming: fuer welche Zwecke werden Medien nachgenutzt
Ergebnisse:
- Öffenlichkeitsarbeit -> verbessern
- Ranking für Suchergebnisse (zB Link auf Creaitonists)
- Retractions linken normalerweise auf Das Retracted Paper
- Most Recent results
- Easter Egg für 42
- Feedback Button
- Rating für Bilder - Unnütze Bilder entfernen
- FAQs hinzufügen
- Man kann nicht für das Projekt Werben, da es im Web nicht vertreten ist. Community Arbeit ist so schwer.
Konvertierung von OA-Texten für die Wikipedia:
Fragen:
- multimedia mining?
- SVG
- Dump oder Workflow?
- Wikibase-Instanz?
- Wikidata vs. DBPedia vs. Wikipedia-Kategorien
- Text- und Bildfeatures?
Brainstorming 1: Gründe für die Bildersuche und Einsatzzwecke
\item Für welchen Zweck haben Sie schon mal Bilder wiederverwertet?
\item Welche Zwecke könnte es sonst noch geben?
\item Welche sonstige Gründe gibt es um nach wiss. Bildern zu suchen?
- Bilder als Inspirationsquelle ("Ohne Vorlage muss man ein Künstler sein")
- Als Vorlage
- In beide Richtungen: Wenn ich für die Wikipedia etwas zeichne, dann orientiere ich mich an Zeichnungen in Fachbüchern
- Regelmäßig kommen mir v. A. Karten in Publikationen oder sogar im Fernsehen bekannt vor – fast immer wurden sie ungekennzeichnet aus der Wikipedia geklaut
- Bisherige Nutzung: Für Wissenschaftliche- & Hausarbeiten
- Beim Erklären von Vorgänge, Prozesse, Methoden suche ich oft nach Beispielbildern.
- Bilder erklären einfacher und schneller als Texte.
- Reverse Bildersuche (Numerische Daten aus Diagramm extrahieren)
- Spaß, Collage, Aufheiterung einer Präsentation
- Übungen/Studium
- Folien/Vorträge
- Netz als zwischenablage
- Forschungsstand checken
- Eye catcher in social media
- Visuelle Suchfunktion
- Nichtwissenschaftliche Artikel
- Infographik: Bild ist eine schnellere als Text
- Personensuchen
- Wiss. Publ und Lehre
- Demo Software, User Interface, Icons
- Copyright-Verletzungen nachgehen
\item Guter Ueberblick ueber externe Nachnutzung von Commons-Medien https://commons.wikimedia.org/wiki/Category:Commons_as_a_media_source
Clusterbildung?
- Zweck beim Prozess der Bildersuche generell
- Einsatzgebiet / Publikationstypen
Brainstorming 2: Wie will ich suchen? Welche Funktionalität erwarte ich?
\item Was müsste eine Suchmaschine für wiss. Bilder können?
\item Welche Hürden und Herausforderungen sehen Sie?
Filtern nach Dateityp, Größe, Lizenz
Filtern nach Typ (Diagramm vs Photo)
filtern kombiniert mit Stichwortsuche (Tags)
Wäre schön zu wissen, woher die Metadaten kommen in denen ich suche, Bsp. AV-Portal https://av.tib.eu/
- Bilder, Video, Audio, 3D und andere nicht-textuelle Materialien nach Nutzerwuenschen zusammen oder getrennt behandeln
Semantische Bildähnlichkeit. Wenn ich eine Virus Zelle suche, möchte ich Beispiele von anderen Viruszellen die ähnlich sind, aber nicht Viruszellen die von ihren Eigenschaften sehr unterschiedlich sind
Bilder die der Suchbegrif-Domäne zugehören und sehr verwand sind.
Filtern nach bestimmten Fachbereichen.
Kontextsuche: Semantisch zusammenhängende (bspw. selber Fachbereich) Bilder sollen auffindbar sein (Viruszellen-Beispiel passt hier auch)
ich will keine eindimensionale Ergebnisliste, sondern die Bildähnlichkeiten untereinander sollen sichtbar sein
explorativ suchen, insbesondere wenn ich nicht genau weiß, welches Bild ich suche
- multilingual sein, z.B. durch Nutzung der Uebersetzungsfunktionen in Wikidata; welche (zusätzlichen) Funktionalitäten ermöglicht das ausschließliche Verwenden von Wikidata zur Erschließung der Grafiken?; Thesaurus, Ontologie
→ Übersetzungstool für die Erstellung von SVGs
- Extrahieren von Metadata-Tags
- Provenance-Info
- Topic diversivisierung / Port-Folio-Effekt
- Zitationsexporte/Kopieren von Bildunterschriften
- Nachnutzung quantifizieren
- Statistiken zu Dateiformaten
- Nutzungsstatistiken
- Annotationen verstehen
Bild-Text-Bezüge erkennen und herstellen
Hürde: Heterogenität von (Bild-/Text-) Daten
Filtern nach Komplexität/Schwierigkeitsgrad
Brainstorming 3
\item Suchen Sie jetzt: \url{http://noa.wp.hs-hannover.de}
\item oder hier: \url{http://noa.wp.hs-hannover.de/variant}
\item Schreiben Sie auf:
\begin{itemize}
\item Warum klappt es nicht?
\item Was hindert mich?
\item Wie würde es leichter gehen?
\item Was fehlt außerdem?
\end{itemize}
\item Design
\begin{itemize}
\item Alternatives Design auf: \url{http://noa.wp.hs-hannover.de/variant}
Was fehlt außerdem?
Basiskategorien, -clustering, z.B. Imagetypen bei der Suche nach Prototyping (oder verfeinert Prototyping Software)
Thematische Klassifikation
Feedbackbutton (mit Session ID) --> WMcommunity draufloslassen
- Bilder, Video, Audio, 3D und andere nicht-textuelle Materialien nach Nutzerwuenschen zusammen oder getrennt behandeln
- multilingual sein, z.B. durch Nutzung der Uebersetzungsfunktionen in Wikidata
***
Jats-Session in April
WikiCite Event im Mai
Wikimania
Wikimedia-Hackathon 19.-21.5. --> Wiki
Suchmaschine: Testrun
--> Kanäle
***
WM Tools http://tools.wmflabs.org/
Vorschläge Daniel Mietchen:
- OA Datenbank und Solr-Suchmaschine auf den WMF-Labs-Server umziehen
- Wikimedia Hackathon und WikiCite (Mai 2017 in Wien) nutzen um die Wikimedia-Community einzubeziehen
- FAQ zu NOA, aus der konsequentes Commitment zu "Open" hervorgeht (also ausschließlich freie Software benutzen und eigene Entwicklungen/Erweiterungen frei lizensiert zugänglich machen etc.)
- Media from Hindawi auf Commons:
Allgemeine Übersicht, wie stark Massenuploads nachgenutzt werden: https://commons.wikimedia.org/wiki/User:Tostman (kenne ich nicht, habe ich mal gefunden)
3D auf Commons: kommt im Maerz fuer AMF und STL formats https://phabricator.wikimedia.org/T132058
Audio als vernachlässigter Objekttyp, was kann man damit machen? (Verweise: Erkennen von gesprochener Sprache im TIB AV-Portal; unabgeschlossener Hackathon für Tierstimmen auf Commons)
Anna Kasprzik: Vortrag über Content Mining an der TIB (PDF per Mail)
- erwähnt u.a. Mini-Ontologie E-Mobilität (Lambert: Querverweis auf BMBF TextTransfer checken)
- Projekt TEASER: Kollaborative Plattform für Thesaurus-Alignment
Eine Collection in RIO fuer das Projekt?