Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Vorhergehende Überarbeitung | |||
— | project:wwwcccde [06.03.2015 21:51] (aktuell) – [Data-Entry] laura | ||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
+ | ====== www.ccc.de ====== | ||
+ | |||
+ | Dieses Projekt hat zum Ziel, eine neue technische Basis für www.ccc.de zu schaffen. Dabei soll die Useability für Leute, die den Content auf ccc.de zur Verfügung stellen, verbessert werden - nur so kann entsprechend bequem und schlagkräftig agiert werden. | ||
+ | |||
+ | ====== Organisatorisches ====== | ||
+ | * **Mailingliste**: | ||
+ | * **Termine** | ||
+ | * Erstes Treffen: Samstag, den 27.7. ab 11 Uhr im Raum. Zielsetzung: | ||
+ | * Zuordnung Aufgaben zu Personen finden | ||
+ | * CMS-Systeme evaluieren (können Links erhalten werden, Fühl für Autoren, etc - Katalog erarbeiten!) - dafür bitte schon funktionierende Kopien erstellen | ||
+ | * Anpassung der Inhaltsstruktur erarbeiten, ggf. direkt an CMS-System anpassen | ||
+ | * Out of scope: Grafische Gestaltung | ||
+ | * **Pads** | ||
+ | * Orga: http:// | ||
+ | * How to migrate content: https:// | ||
+ | * URL-Liste: https:// | ||
+ | ====== Problembeschreibung ====== | ||
+ | |||
+ | Das gegenwärtige System (https:// | ||
+ | |||
+ | Das neue System muss ähnlich performant sein und gleichzeitig sicher. Darüber hinaus soll die neue Infrastruktur besser bedienbar sein, d.h. die Autoren sollen in einem bekannten Interface mit entsprechendem Komfort arbeiten können. Es geht hierbei nicht um die technisch schickste Lösung, sondern um die von der Useability her tollste Sache. | ||
+ | |||
+ | Zusätzlich muss der Content von www.ccc.de (und auch das " | ||
+ | |||
+ | WICHTIG: Das ist nicht der erste Anlauf, das perfekte www.ccc.de zu erfinden. Die Dokumentation des ersten Rewrite ist im Dokuwiki zu finden: | ||
+ | |||
+ | * https:// | ||
+ | * https:// | ||
+ | ====== Lösungsvorschlag ====== | ||
+ | |||
+ | Note: Dieser muss evaluiert werden und ist nicht in Stein gemeisselt. | ||
+ | |||
+ | - Die bisherige Hostinginfrastruktur soll erhalten bleiben, d.h. die bewährte Kombination aus nginx und varnish sollte nicht angefasst grundlos verändert werden. Auch aus Sicherheitsaspekten heraus soll der Content z.B. via wget -m gemirrored werden und wird dann statisch ausgeliefert. | ||
+ | - Zum Erstellen des Contents wird $CMS verwendet. Wordpress ist eine Möglichkeit, | ||
+ | - Die Struktur der bisherigen Seite wird nachgebaut, ggf. durch weitere Untermenüs besser navigierbar gemacht. Dabei werden die Inhalte auf CCC.de manuell als neue Einträge in das Wordpress eingepflegt. Dabei muss unbedingt auf den Erhalt der URLs geachtet werden. Eine Versionierung der Webseite durch ein " | ||
+ | - Das Theme sollte chaosorientiert sein, gerne aber etwas aufgefrischt und im Hinblick auf mobile Datenempfangsgeräte responsiv gestaltet werden. Ein entsprechend einfach zu modifizierendes Theme muss noch gesucht werden - gerne auch von Leuten, die Erfahrung mit dem Customizing der Themes haben. | ||
+ | - Wichtig: Für Dokumentationszwecke (ggf. auch juristische Auseinandersetzungen) sollen die einzelnen Webseitenversionen archiviert sein. Beim Mirrorn der statischen Webseite wird einfach bei einer Änderung ein Git-commit gemacht, der die komplette Version in ein Repository sichert. Da dabei nur die geänderten Seiten gespeichert werden, ist auch kein Speicherplatzproblem zu erwarten. | ||
+ | |||
+ | ====== Konkretes Vorgehen ====== | ||
+ | |||
+ | - Aufbau eines (oder mehrerer) Testsystems, | ||
+ | - Es gibt nun zwei Testinstallationen von Wordpress - http:// | ||
+ | - Aufteilung in Teams: | ||
+ | - Content-Migration: | ||
+ | - HTML& | ||
+ | - Betatest. Hier wird das Testsystem einem größeren Personenkreis zugänglich gemacht, ggf. auftretende Fuckups müssen diskutiert werden. | ||
+ | - Rollout - ggf. auf der bereits bestehenden Infrastruktur. | ||
+ | - Maintenance - hier können wir auch aktiv bleiben. | ||
+ | |||
+ | ======= Migration ======= | ||
+ | Howto: [[project: | ||
+ | |||
+ | ======= Setup der Webseite ======= | ||
+ | Howto: [[project: | ||
+ | |||
+ | |||
+ | ====== Suchmaschine ===== | ||
+ | |||
+ | Als Suchmaschine bietet sich Apache Solr (Engine) mit Nutch (Crawler) an, wobei die Skalierung auch bei extremen Größenordnungen noch gegeben ist. Dynamischer Content wird auch indiziert, wobei es wie auch bei Google gewisse Einschränkungen gibt. robotx.txt Files werden beachtet. Ein Prototyp ensteht unter https:// | ||
+ | |||
+ | **Zugangsdaten search.c3event.de** | ||
+ | |||
+ | //Kann zeitweise offline sein// | ||
+ | |||
+ | Username: ccc | ||
+ | |||
+ | Passwort: ncc1701 | ||
+ | |||
+ | **Erkenntnisse** | ||
+ | |||
+ | * Je nach Anwendung kann der Crawler auch lokal auf dem Zielserver laufen, was je nach Anwendung sinnvoll sein kann. | ||
+ | * Es können mehrere Crawler laufen, die an eine oder mehrere Solr Instanzen berichten | ||
+ | * Die Suche kann auch von verschiedenen Erfas genutzt werden, so könnten die Webangebote der verschienen Erfas zentral indiziert werden | ||
+ | * Der Crawler ist nicht nur auf http(s) beschränkt | ||
+ | * Nutzung von Cloudflare bei besonderen Lastsituationen? | ||
+ | * Je nach Umfang des Webauftritts sehr hohe Speicheranforderungen (Apache Hadoop lässt grüßen) | ||
+ | * Die Qualität der Suche kann sich sehen lassen, bleibt noch abzuwarten, was der mit PDF oder OpenOffice Files macht. Microsoft Office mag er offenbar nicht -> Wird nicht indiziert. | ||
+ | * Der Crawler benötigt noch einiges Tuning (Speicherlast vs. Speed) | ||
+ | * Probleme beim Compilieren von OpenJDK unter FreeBSD, daher Testsystem zunächst auf Debian Linux implementiert, | ||
+ | |||
+ | **Userinterface** | ||
+ | |||
+ | KISS (Keep It Stupid and Simple) erlaubt nicht nur eine einfache Integration, | ||
+ | |||
+ | Wenn für unseren neuen Webauftritt ein passendes SOLR Schema gefunden ist, dann wären noch Fragen zum Search GUI zu klären, wobei grundsätzlich folgende Wege möglich sind: | ||
+ | |||
+ | - Direkter Zugriff mit XML über den Webservice? Vorteil: Kann jederzeit geändert werden. Die XML Antwort muss jedoch über ein XSLT in HTML umgewandelt werden. | ||
+ | - Eigener Tomcat/ | ||
+ | - @Erfas: Eigener Crawler oder vom CCC Crawler indizieren lassen? - muss jeder Erfa für sich entscheiden, | ||
+ | |||
+ | |||
+ | |||
+ | **Updates** | ||
+ | |||
+ | * 10.01.2014: Suggestion Funktion auf Server läuft, jedoch Userfrontend muss das zu Fuß über XML machen | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ====== Fragestellungen/ | ||
+ | |||
+ | Hier bitte konzeptionelle Probleme auflisten, die bei der Evaluation/ | ||
+ | |||
+ | * Die Suchfunktionialität des aktuellen ccc.de wird auf Serverseite erzeugt - das aktuelle CCC.de ist also nicht komplett statisch. Allerdings scheint der Rest statisch ausgeliefert zu werden. Entsprechende Weiterleitungen im NGINX? | ||
+ | * Multilanguage-Support | ||
+ | * ... siehe Etherpad (vorerst) | ||
+ | * Zertifikate: | ||
+ | |||
+ | |||
+ | ==== Metadaten ==== | ||
+ | ---- dataentry projekt ---- | ||
+ | name : www.ccc.de | ||
+ | contact | ||
+ | tags_tags | ||
+ | type : projekt | ||
+ | subtype | ||
+ | sticky_hidden : no | ||
+ | ---- | ||