WEBVTT

00:09.590 --> 00:10.770
Dankeschön, lieber Tamin.

00:11.450 --> 00:15.010
Herzlich willkommen auch von meiner Seite heute Abend.

00:16.550 --> 00:19.870
Jetzt haben wir sehr viel über Software gehört, wie man Software

00:19.870 --> 00:24.030
richtig macht, wie man die ganzen Sachen sicher auch macht.

00:24.810 --> 00:29.410
Und jetzt möchte ich tatsächlich mal über Daten reden und über große

00:29.410 --> 00:29.810
Daten.

00:31.110 --> 00:33.970
Nun, der Titel meines Vortrages lautet 20 Jahre große

00:33.970 --> 00:36.030
wissenschaftliche Daten in Karlsruhe.

00:36.030 --> 00:38.510
Ich komme vom SCC, dem Rechenzentrum.

00:39.070 --> 00:42.290
Eine Folie kurz zu uns, wer wir eigentlich sind und dann geht es mit

00:42.290 --> 00:45.410
den 20 Jahren und großen wissenschaftlichen Daten in Karlsruhe auch

00:45.410 --> 00:45.870
schon los.

00:47.550 --> 00:50.630
Nun, wie Tamin gerade gesagt hat, wir sind das Rechenzentrum.

00:51.170 --> 00:52.610
Und jetzt könnte ich eigentlich schon fertig sein.

00:53.650 --> 00:55.870
Wir sind aber ein sehr stark forschendes Rechenzentrum.

00:56.110 --> 01:00.170
Wir sind der IT-Betreiber, das IT-Zentrum des KIT.

01:01.310 --> 01:03.730
Und das sind unsere vier Aufgaben, die wir haben.

01:03.730 --> 01:09.570
Wir machen selbstverständlich zuallererst quasi die Basisdienste für

01:09.570 --> 01:15.010
das KIT, also das Netzwerk, die E-Mail, Outlook, Termine, alles

01:15.010 --> 01:15.470
Mögliche.

01:15.550 --> 01:20.830
Das machen wir als SCC für das gesamte KIT, für alle rund 10.000

01:20.830 --> 01:24.650
Mitarbeitenden und 25.000 Studierenden hier am KIT.

01:25.870 --> 01:30.830
Zweitens betreiben und entwickeln wir sogenannte IT-Anwendungssysteme.

01:31.350 --> 01:31.950
Was ist das?

01:31.950 --> 01:38.090
Das sind Systeme wie zum Beispiel SAP, sodass wir als KIT mit dem Geld

01:38.090 --> 01:40.750
umgehen können, Bestellungen machen können und so weiter.

01:41.450 --> 01:44.950
Wir betreiben aber auch so Dienste wie zum Beispiel das Campus-System

01:44.950 --> 01:49.290
oder das ILEAS-System, die elementar sind, dass bei uns am KIT Studium

01:49.290 --> 01:51.610
und Lehre tatsächlich durchgeführt werden können.

01:52.230 --> 01:56.590
Dass Studierende zum Beispiel die Unterlagen zur Vorlesung auch

01:56.590 --> 01:58.710
runterladen können und darauf zugreifen können.

01:59.630 --> 02:03.610
Das sind im Prinzip so die beiden Hauptaufgaben, die jedes normale

02:03.610 --> 02:06.490
Rechenzentrum an einer Universität in ganz Deutschland eigentlich hat.

02:06.550 --> 02:10.870
Was uns besonders macht ist, da gibt es nicht so viele in Deutschland

02:10.870 --> 02:14.550
von, dass wir sogenannte IT-Großgeräte betreiben.

02:14.970 --> 02:20.590
Also sehr große IT-Geräte, zuvorderst Systeme im Bereich des

02:20.590 --> 02:24.730
Hochleistungsrechnens und im Bereich der großen Datenmengen.

02:24.730 --> 02:29.270
Wir kürzen das quasi ab und sagen, wir betreiben Forschungsgroßgerät

02:29.270 --> 02:31.410
im Bereich des datenintensiven Rechnens.

02:32.810 --> 02:35.070
Und der vierte Punkt zeichnet uns wirklich aus.

02:35.810 --> 02:42.170
Wir machen sehr, sehr viel Forschung bei uns im SCC selbst, im Bereich

02:42.170 --> 02:43.690
eben datenintensives Rechnen.

02:44.170 --> 02:45.750
Die Abkürzung möchte ich kurz auflösen.

02:45.870 --> 02:48.190
FDM steht für Forschungsdatenmanagement.

02:48.370 --> 02:51.270
Wie kann ich also mit großen Forschungsdaten gut umgehen?

02:51.930 --> 02:55.570
HPC steht für High Performance Computing, also auf Deutsch

02:55.570 --> 02:58.270
Hochleistungsrechnen oder Höchstleistungsrechnen.

02:59.230 --> 03:01.690
KI hatten wir heute schon gelernt, Künstliche Intelligenz.

03:01.770 --> 03:04.650
Und QC hatten wir auch schon gelernt, Quantencomputing.

03:05.530 --> 03:08.310
Und das Ganze soll natürlich auch sicher sein, hatten wir heute auch

03:08.310 --> 03:10.450
schon im Vortrag, sichere IT-Föderation.

03:12.770 --> 03:15.590
Wir sind sehr, sehr intensiv mit unserer Forschung und mit unseren

03:15.590 --> 03:19.390
Aktivitäten in der Helmholtz-Gemeinschaft beteiligt.

03:19.390 --> 03:22.770
Sie wissen ja hoffentlich alle, dass das KIT nicht nur eine reine

03:22.770 --> 03:26.930
Landesuniversität ist, sondern eben auch Teil der deutschen Helmholtz

03:26.930 --> 03:27.450
-Gemeinschaft.

03:28.170 --> 03:31.230
Und wir haben natürlich sehr viele regionale, also Landesprojekte,

03:31.370 --> 03:35.030
BMBF -Projekte, nationale Projekte, EU-Projekte, internationale

03:35.030 --> 03:35.470
Projekte.

03:36.510 --> 03:40.570
Seit diesem Jahr haben wir tatsächlich die 300-Personen-Marke

03:40.570 --> 03:41.470
überschritten.

03:41.470 --> 03:44.810
Wir haben das auch immer, halten das auch immer nach.

03:45.230 --> 03:50.010
Mehr als 25 Nationen sind bei uns im SCC beschäftigt in insgesamt 16

03:50.010 --> 03:51.890
Abteilungen und Forschungsgruppen.

03:52.510 --> 03:56.390
Und wir sind an beiden Kampi, an beiden Standorten, Hauptstandorten

03:56.390 --> 04:00.490
des KIT am Campus Nord draußen, Eggenstein, Leopoldshafen, wie auch

04:00.490 --> 04:05.450
hier in der Stadt im Campus Süd vertreten mit großen Gebäuden und

04:05.450 --> 04:07.050
Rechenzentrumsräumen auch.

04:08.250 --> 04:10.570
So, was geschah eigentlich vor 20 Jahren?

04:10.570 --> 04:12.510
Ja, so ist ja der Titel meines Vortrages.

04:13.570 --> 04:17.010
Vor 20 Jahren, etwas mehr sogar, vor 22 Jahren, am 1.

04:17.170 --> 04:22.370
Juli 2001, veröffentlichte die deutsche Hochenergiephysik-Community,

04:22.510 --> 04:27.650
also ein spezieller Bereich der Physikforschung, veröffentlichte ein

04:27.650 --> 04:32.210
Dokument, das heißt Anforderungen für ein regionales Daten- und

04:32.210 --> 04:35.590
Computingzentrum in Deutschland, RDCCG.

04:36.470 --> 04:39.270
Wir haben das Dokument quasi gesichert, wie man das gut im

04:39.270 --> 04:41.830
Forschungsdatenmanagement macht und wenn die Folien hinterher verteilt

04:41.830 --> 04:44.990
werden, können Sie hier auf diesen Link drücken und können sich dieses

04:44.990 --> 04:46.210
Dokument noch anschauen.

04:48.150 --> 04:52.010
Damals gab es noch nicht das KIT, sondern das Forschungszentrum

04:52.010 --> 04:53.870
Karlsruhe, hat dann am 5.

04:54.010 --> 04:59.270
Dezember 2001, im gleichen Jahr noch, eine Antwort eingereicht, wie

04:59.270 --> 05:02.890
wir uns das in Karlsruhe vorstellen, um diesen Anforderungen der

05:02.890 --> 05:05.990
deutschen Hochenergiephysik-Community gerecht zu werden.

05:07.610 --> 05:11.070
Und erstaunlicherweise, für heutige Zeiten erstaunlicherweise, gab es

05:11.070 --> 05:17.150
extrem schnell Geld vom BMBF, sodass relativ rasch die erste Hardware

05:17.150 --> 05:19.790
auch tatsächlich installiert werden konnte.

05:20.430 --> 05:23.870
Und dann fand ungefähr ein Jahr später, am 30.

05:24.110 --> 05:27.430
Oktober 2002, das große Einweihungskolloquium statt.

05:27.810 --> 05:32.290
Hier auf dem Bild, das ist in der sogenannten FTU-Aula am Campus Nord

05:32.290 --> 05:35.950
gemacht, sehen Sie auf der linken Seite Herrn Maschuh, das ist einer

05:35.950 --> 05:38.490
der damaligen Vorstände vom Forschungszentrum Karlsruhe.

05:38.990 --> 05:43.730
Und der da hinter dem Pult steht, ist Les Robertson vom CERN, der

05:43.730 --> 05:47.490
quasi der Chef dieser damaligen Computing-Unternehmung war.

05:48.050 --> 05:51.990
CERN, habe ich schon gesagt, Hochenergiephysik, es geht also um die

05:51.990 --> 05:55.630
Daten des LHC-Beschleunigers am CERN.

05:55.950 --> 05:58.690
Der größten je von Menschen gebauten Maschine.

05:59.450 --> 06:01.870
Darf ich vielleicht mal hier in den Raum fragen, wer hat von Ihnen

06:01.870 --> 06:04.150
schon mal vom LHC am CERN gehört?

06:04.270 --> 06:05.850
Bitte mal die Hand heben.

06:07.770 --> 06:08.790
Wunderbar, gut.

06:09.550 --> 06:10.810
Also was wird vereinfacht gemacht?

06:10.890 --> 06:13.150
Ich kann das nicht richtig gut erklären, ich bin nur ein Informatiker,

06:13.250 --> 06:13.890
kein Physiker.

06:13.890 --> 06:17.490
Stellen Sie sich vor, Sie nehmen zwei Atome, beschleunigen die auf

06:17.490 --> 06:21.430
extrem hohe Geschwindigkeit, nah an der Lichtgeschwindigkeit, und dann

06:21.430 --> 06:25.090
steuern Sie diese beiden Strahlen so intelligent aus, dass Sie die

06:25.090 --> 06:26.450
beiden Strahlen bzw.

06:26.650 --> 06:29.310
Atome aufeinander führen und die kollidieren.

06:30.170 --> 06:31.030
Sie stoßen zusammen.

06:32.070 --> 06:34.450
Und Atome, hat man mal in der Schule gelernt, ist so die kleinste

06:34.450 --> 06:35.650
Einheit eigentlich, die es gibt.

06:36.050 --> 06:36.510
Ist falsch.

06:37.290 --> 06:40.830
Es gibt noch viel kleinere Teilchen, aus denen Atome zusammengesetzt

06:40.830 --> 06:41.070
werden.

06:41.070 --> 06:44.410
Und diese kann man eben nur finden, wenn man die mit extrem hoher

06:44.410 --> 06:47.410
Geschwindigkeit aufeinander schießt, dann entsteht eine kleine

06:47.410 --> 06:48.110
Explosion.

06:48.250 --> 06:51.770
Und diese kleinen Teilchen kann man dann in sehr großen Detektoren

06:51.770 --> 06:52.070
finden.

06:53.950 --> 06:58.410
Stellen Sie sich ganz vereinfacht so vor, so ein Detektor ist eine

06:58.410 --> 07:00.290
riesige digitale Kamera.

07:01.490 --> 07:05.630
Und riesig heißt ungefähr so groß wie der Raum, wie dieser Raum hier.

07:07.110 --> 07:08.730
Riesig wirklich, wenn man davor steht.

07:11.070 --> 07:13.990
Und Sie kennen das von Ihrer eigenen Digitalkamera, die ja nur so

07:13.990 --> 07:16.330
klein ist, da entstehen verdammt viele Daten.

07:16.770 --> 07:19.310
Wenn Sie jetzt also eine Digitalkamera haben, die so groß ist wie

07:19.310 --> 07:21.890
dieser ganze Raum, entstehen verdammt viele Daten.

07:23.010 --> 07:25.790
Und die möchten die Physikerinnen und Physiker auf der ganzen Welt

07:25.790 --> 07:31.250
speichern und analysieren und anschauen und daraus neues Wissen

07:31.250 --> 07:31.730
generieren.

07:32.350 --> 07:35.190
Nämlich, was sind die Bauteile eines Atoms.

07:36.410 --> 07:38.390
Und genau darum geht es hier.

07:39.970 --> 07:44.770
Und seit 20 Jahren gibt es GRID-K, das K-A steht natürlich für

07:44.770 --> 07:47.670
Karlsruhe, eine internationale User Facility.

07:48.670 --> 07:52.590
Wir sind das deutsche Daten- und Analysezentrum für die sogenannte

07:52.590 --> 07:54.490
Teilchen - und Astroteilchenphysik.

07:55.750 --> 08:04.150
Sie sehen hier die vier Experimente ALICE, ATLAS, CMS und LHC-B, die

08:04.150 --> 08:08.530
vier Experimente, die es am LHC-Beschleuniger am CERN gibt.

08:09.750 --> 08:12.370
In der Zwischenzeit, das sind quasi unsere Hauptkunden, in der

08:12.370 --> 08:14.730
Zwischenzeit sind noch ein paar Experimente hinzugekommen.

08:14.730 --> 08:19.890
Zum Beispiel das BELL-2-Experiment mit diesem blau-gelben Logo in

08:19.890 --> 08:22.730
Japan oder auch Experimente aus der Astroteilchenphysik.

08:23.730 --> 08:27.290
Also die nehmen nicht Atome und beschleunigen die von uns Menschen

08:27.290 --> 08:30.330
quasi und schießen die aufeinander, sondern hier sorgt quasi das

08:30.330 --> 08:32.130
Universum für die Beschleunigung.

08:32.830 --> 08:35.630
Und man guckt einfach, wie viele von diesen Teilchen hier bei uns an

08:35.630 --> 08:39.710
der Erde ankommen und dann durch die Atmosphäre sich zerteilen in

08:39.710 --> 08:41.730
Subteilchen und diese versucht man zu detektieren.

08:42.390 --> 08:45.730
Es gibt sehr interessante Instrumente, die das feststellen können.

08:45.870 --> 08:48.770
Leider alle etwas weiter weg von hier in der südlichen Hemisphäre

08:48.770 --> 08:49.350
unserer Welt.

08:50.130 --> 08:53.110
Zum Beispiel in Argentinien, in der Pampa dort oder tatsächlich am

08:53.110 --> 08:56.050
Südpol gibt es das berühmte ICE-Cube-Experiment.

08:57.270 --> 09:00.590
Und von all diesen Experimenten haben wir Daten hier in Karlsruhe.

09:01.150 --> 09:05.070
Sie sehen hier die Anzahl an Menschen, die GRID-Ca verwenden.

09:05.910 --> 09:10.690
Und GRID-Ca, Karlsruhe, ist ebenso ein fundamentaler Baustein in der

09:10.690 --> 09:15.690
weltweiten Datenverarbeitungskette des Large Hadron Collider, des LHC

09:15.690 --> 09:19.970
-Beschleunigers am CERN, wo Sie hier links so ein Bild sehen von einem

09:19.970 --> 09:24.570
der Detektoren, die hier auch mit Karlsruher Hilfe zusammengebaut

09:24.570 --> 09:24.870
wurden.

09:24.870 --> 09:28.490
Und in der Mitte dieser Kasten, das ist das, was wir quasi machen.

09:28.590 --> 09:32.850
Wir empfangen die Daten, die vom CERN kommen, speichern die,

09:33.250 --> 09:37.750
archivieren die, verarbeiten die und geben sie dann weiter auch raus

09:37.750 --> 09:38.690
wieder in die Welt.

09:41.930 --> 09:43.150
Nun, womit machen wir das?

09:43.610 --> 09:45.030
Da braucht man ein bisschen Hardware für.

09:46.510 --> 09:50.270
Hier sehen Sie die Ressourcen, die wir in diesem Jahr für die

09:50.270 --> 09:53.210
internationale Gemeinde zur Verfügung stellen.

09:54.050 --> 09:57.990
Man braucht zunächst einmal Rechenleistung, um mit den Daten irgendwas

09:57.990 --> 09:59.870
machen zu können, um sie analysieren zu können.

10:00.450 --> 10:03.370
Da haben wir in der Summe 61.000 CPU-Kerne.

10:04.390 --> 10:07.490
Dein Notebook hier wird wahrscheinlich so acht CPU-Kerne ungefähr

10:07.490 --> 10:07.790
haben.

10:07.910 --> 10:09.770
Das ist so typisch, was man so in dem Notebook hat.

10:10.250 --> 10:11.510
Also 61.000.

10:12.370 --> 10:15.850
Eine andere Größenordnung, um eine andere Größenordnung zu geben, wenn

10:15.850 --> 10:20.110
Sie heute sehr, sehr leistungsfähige Serversysteme kaufen, sind so die

10:20.110 --> 10:24.130
größten CPU-Prozessoren, die Sie bekommen können, haben ungefähr 128

10:24.130 --> 10:24.850
Kerne.

10:25.890 --> 10:29.290
Also von solchen Prozessoren haben wir also eine ganze Menge hier

10:29.290 --> 10:29.770
eingebaut.

10:30.690 --> 10:33.910
Dann braucht es Speicher, Datenspeicher.

10:35.090 --> 10:38.910
Da haben wir knapp 100 Petabyte an Online-Speicher.

10:39.570 --> 10:40.510
Das sind Festplatten.

10:42.050 --> 10:46.010
Ich habe hier in der Hand eine SSD-Festplatte.

10:46.010 --> 10:47.170
Das haben Sie vielleicht schon mal gehört.

10:47.890 --> 10:49.090
Das sind richtig schnelle Festplatten.

10:49.310 --> 10:51.970
Diese SSD-Festplatte, die ich in der Hand habe, die ist so, naja,

10:52.070 --> 10:54.030
vielleicht acht Millimeter dick und Sie sehen, so groß wie eine

10:54.030 --> 10:58.330
Scheckkarte, hat ein Terabyte Speicherkapazität.

10:59.770 --> 11:02.930
Ein Petabyte sind tausend von den Dingern.

11:04.050 --> 11:09.750
Und wenn da 99 Petabyte steht, ist das 99.000 Mal das, was ich hier in

11:09.750 --> 11:10.330
der Hand halte.

11:12.930 --> 11:14.290
99.000 Mal.

11:16.210 --> 11:19.070
Tatsächlich haben wir nicht so eine Technologie, das wäre zu teuer.

11:19.350 --> 11:21.150
Das Ding kostet ungefähr 200 Euro.

11:21.650 --> 11:24.430
Sondern wir haben noch tatsächlich die ganz alten klassischen

11:24.430 --> 11:25.330
Magnetfestplatten.

11:26.030 --> 11:27.330
Das, was Sie vielleicht von früher kennen.

11:27.430 --> 11:31.350
Da ist eine Scheibe drin und ein Arm, der so drüber geht und da dann

11:31.350 --> 11:32.330
die Daten speichert.

11:33.130 --> 11:36.590
Davon haben wir eben einige tausend Festplatten.

11:39.030 --> 11:43.370
Solche Festplatten eignen sich wunderbar, um Daten zu speichern, die

11:43.370 --> 11:44.390
man immer mal wieder braucht.

11:44.890 --> 11:48.370
Für lange Zeit Daten aufzuheben, sollte man nicht auf diesen

11:48.370 --> 11:49.090
Festplatten tun.

11:50.270 --> 11:53.030
Wer hat von Ihnen, machen wir noch einen Test, wer hat von Ihnen zu

11:53.030 --> 11:56.770
Hause schon mal erlebt, bei Ihrem privaten Rechner, dass einfach die

11:56.770 --> 12:00.050
Festplatte gecrashed ist, ein Headcrash zum Beispiel gibt.

12:00.370 --> 12:03.270
Also dass dieser Arm, der eigentlich lässt, quasi abgesunken ist auf

12:03.270 --> 12:06.070
die sich drehende Scheibe und dann alles kaputt war und Sie ganz viel

12:06.070 --> 12:06.750
Datenverlust hatten.

12:06.790 --> 12:07.650
Wer hat das schon mal erlebt?

12:09.190 --> 12:09.550
Ja.

12:10.990 --> 12:13.070
Das ist das Problem bei sich so drehenden Festplatten.

12:13.530 --> 12:17.290
Was man macht, um Daten für sehr lange Zeit aufzuheben, ist, man

12:17.290 --> 12:19.030
speichert die auf Magnetband.

12:20.810 --> 12:23.010
VHS-Kassetten, kennen sicherlich hier noch einige im Raum.

12:23.250 --> 12:26.570
VHS-Kassetten, die es früher mal gab, sind Magnetbänder.

12:26.570 --> 12:31.630
Die gleiche Technologie ist heute noch state of the art.

12:31.730 --> 12:32.830
Das ist das Mittel.

12:32.930 --> 12:34.670
Es gibt keine andere Konkurrenz.

12:34.770 --> 12:39.770
Das ist das, die Technologie, um Daten für lange Zeit zu archivieren.

12:40.910 --> 12:42.950
In so einer Kassette, ich habe jetzt keine mitgebracht, aber die ist

12:42.950 --> 12:47.370
ungefähr so groß, sind ungefähr 1,2 Kilometer Magnetband drin und

12:47.370 --> 12:50.730
gehen dann in der neuesten Technologie hier 20 Terabyte auf dieses

12:50.730 --> 12:52.370
Magnetband zum Archivieren.

12:54.310 --> 12:56.890
So, die Daten müssen auch irgendwie zu uns kommen, nach Karlsruhe und

12:56.890 --> 12:57.490
auch wieder weggehen.

12:57.590 --> 12:59.510
Das heißt, wir haben so etwas wie eine Fritzbox, wie einen

12:59.510 --> 13:00.330
Internetanschluss.

13:00.870 --> 13:03.950
Der ist bei uns 400 Gigabit pro Sekunde.

13:04.930 --> 13:06.790
Jetzt werden Sie sagen, naja, das ist ja gar nicht so viel.

13:07.230 --> 13:10.550
Ich kann ja irgendwie bei, wie heißen die alle, Vodafone, Unity Media

13:10.550 --> 13:14.110
und so weiter, kann ich mir bis zu einem 1 Gigabit Anschluss auch

13:14.110 --> 13:14.390
holen.

13:15.350 --> 13:18.850
Ich habe zu Hause zum Beispiel einen 250 Megabit Anschluss, also einen

13:18.850 --> 13:21.410
Viertel Gigabit Anschluss.

13:22.310 --> 13:23.970
Haben vielleicht einige hier im Raum auch.

13:24.510 --> 13:28.150
Das ist nicht so spannend, das, was man aus dem Internet runterladen

13:28.150 --> 13:28.410
kann.

13:29.110 --> 13:33.170
Richtig spannend und teuer wird es, wenn Sie das mit der gleichen

13:33.170 --> 13:35.550
Geschwindigkeit rausgeben wollen.

13:36.350 --> 13:39.690
Da habe ich zum Beispiel zu Hause nur 50 Megabit.

13:42.030 --> 13:46.970
Hier haben wir Up and Down, wie man so schön sagt, 400 Gigabit.

13:46.970 --> 13:51.030
Das heißt, es ist 8000 Mal schneller als mein Internetanschluss zu

13:51.030 --> 13:51.190
Hause.

13:52.550 --> 13:56.350
Er kostet auch ein bisschen mehr, der Internetanschluss des KIT.

13:58.350 --> 13:59.850
So, das sind sehr viele Ressourcen.

14:00.430 --> 14:04.250
Im globalen Maßstab, es gibt noch in anderen Ländern der Welt und auf

14:04.250 --> 14:07.910
anderen Kontinenten ähnliche Rechenzentren, stellen wir hier in

14:07.910 --> 14:12.910
Karlsruhe 15% der weltweiten sogenannten Tier 1 Ressourcen zur

14:12.910 --> 14:13.270
Verfügung.

14:13.270 --> 14:17.830
Wir sind tatsächlich weltweit das größte sogenannte Tier 1

14:17.830 --> 14:20.370
Datenzentrum für die LHC-Daten.

14:23.810 --> 14:26.050
Computing am SCC ist aber viel mehr.

14:27.950 --> 14:31.690
Aus Grid Card, 20 Jahre machen wir das schon, ist in der Zwischenzeit

14:31.690 --> 14:32.850
sehr, sehr viel entstanden.

14:33.470 --> 14:37.090
Wir haben sehr, sehr große Supercomputer, Horeca war auch schon mal in

14:37.090 --> 14:38.230
der Zeitung, in der BNN.

14:38.890 --> 14:41.830
Wir sind in sehr vielen nationalen und internationalen Verbünden

14:41.830 --> 14:45.450
unterwegs, machen sehr viel in der Helmholtz-Forschung, machen auch

14:45.450 --> 14:49.410
Dinge zu künstlicher Intelligenz und sonstigen spannenden

14:49.410 --> 14:50.170
Forschungsthemen.

14:50.470 --> 14:53.490
Und jetzt habe ich Ihnen noch zwei Folien mitgebracht zu den

14:53.490 --> 14:54.910
Forschungsthemen, die wir machen.

14:56.230 --> 14:59.890
Hier auf der Folie stehen schon sehr viele Ressourcen drauf, aber

14:59.890 --> 15:03.190
Physiker sind noch viel ressourcenhungriger.

15:03.610 --> 15:05.230
Sie möchten noch mehr Ressourcen verwenden.

15:06.090 --> 15:09.550
Und wir entwickeln hier gemeinsam zwischen dem SCC und dem

15:09.550 --> 15:12.830
Physikinstitut ETP eine Software, da sind wir wieder bei dem

15:12.830 --> 15:15.550
vorherigen Thema, auch eine Open Source Software, also die frei

15:15.550 --> 15:20.590
verfügbar ist, zur sogenannten opportunistischen Ressourcennutzung.

15:20.690 --> 15:21.530
Worum geht es da?

15:22.430 --> 15:26.870
Wenn irgendwo auf der Welt mal Ressourcen, CPUs zum Beispiel, frei

15:26.870 --> 15:30.130
sind oder sehr günstig zu haben sind, zum Beispiel bei Cloud

15:30.130 --> 15:36.650
-Anbietern, dann ermöglicht es diese Software, diese Ressourcen, die

15:36.650 --> 15:40.430
ja mal frei sind und mal nicht frei sind, dynamisch quasi in unsere

15:40.430 --> 15:41.830
Arbeitsabläufe einzubinden.

15:44.250 --> 15:48.410
Und spannend ist sowas, man muss sowas auch nicht nur korrekt, quasi

15:48.410 --> 15:54.430
die Korrektheit beweisen können oder nachvollziehen können, sondern es

15:54.430 --> 15:56.410
ist auch ganz wichtig, dass die Skalierung stimmt.

15:56.550 --> 15:59.010
Also dass das nicht nur mit ein paar Sachen funktioniert, sondern mit

15:59.010 --> 15:59.990
sehr, sehr viel funktioniert.

16:00.690 --> 16:04.470
Und hier sehen Sie mal, wo wir auf einen Schlag mehr als 10.000

16:04.470 --> 16:09.770
zusätzliche Kerne reingezogen haben, die wir von unserem Supercomputer

16:09.770 --> 16:11.350
mal kurz quasi ausgeliehen haben.

16:12.850 --> 16:15.970
Und das ist so ein elementarer Baustein für viele andere Initiativen

16:15.970 --> 16:19.090
jetzt auf der deutschen und europäischen Ebene, wo wir diese Software

16:19.090 --> 16:20.810
eben auch zum Einsatz bringen.

16:22.450 --> 16:24.150
Und jetzt kommen wir auch noch mal zum Thema KI.

16:24.830 --> 16:27.330
Bleiben wir in der Thematik Teilchenphysik.

16:27.330 --> 16:31.610
Hier arbeiten wir mit dem BELT2-Experiment zusammen, auch mit

16:31.610 --> 16:36.290
Kolleginnen und Kollegen hier in Karlsruhe, aber auch in Straßburg und

16:36.290 --> 16:36.670
in Bonn.

16:36.950 --> 16:43.310
Und hier haben wir einen KI-Ansatz entwickelt, der viel besser eine

16:43.310 --> 16:46.070
sogenannte Rekonstruktion von Teilchenzerfällen macht.

16:46.270 --> 16:50.570
Also, noch mal erklärt, diese zwei Atome schließen aufeinander, diese

16:50.570 --> 16:53.530
beiden Atome zerfallen in viele einzelne Teilchen und man möchte ja

16:53.530 --> 16:56.530
irgendwie wissen, was waren das alles für Teilchen?

16:56.850 --> 16:59.110
Das ist hier in diesem Baumdiagramm quasi dargestellt.

16:59.710 --> 17:03.630
Das quasi zu rekonstruieren, da kann man eben auch mit KI was machen.

17:05.010 --> 17:08.690
Wir machen aber nicht nur KI-Forschung für die internationale Physik

17:08.690 --> 17:12.890
-Community, sondern auch ganz nah hier tatsächlich für Karlsruhe.

17:13.670 --> 17:19.710
Hier sehen Sie das Ergebnis einer Forschungsarbeit, wo es um die

17:19.710 --> 17:22.710
Entdeckung von thermischen Leckagen bei Gebäuden geht.

17:23.510 --> 17:26.130
Das haben wir hier mit dem IIP am KIT gemacht.

17:26.630 --> 17:30.150
Wenn Sie genau hinschauen, erkennen Sie hier auf dem ersten Bild von

17:30.150 --> 17:32.710
den dreien, dass es hier ganz in der Ecke, in der Nähe ist.

17:32.910 --> 17:38.190
Dieses orangefarbene Gebäude hier ist, glaube ich, Teil der

17:38.190 --> 17:38.850
Landesbank.

17:38.990 --> 17:41.350
Also in diese Richtung weiterlaufend würde dann irgendwo das Schloss

17:41.350 --> 17:41.610
stehen.

17:42.970 --> 17:45.790
Und was hier gemacht wurde ist, hier sind Drohnen, hier ist eine

17:45.790 --> 17:51.090
Drohne mit einer Infrarotkamera über Karlsruhe hinweggeflogen und hat

17:51.090 --> 17:53.870
so Aufnahmen wie hier in der Mitte gemacht.

17:54.770 --> 17:58.450
Also eine Wärmebildkamera hat Aufnahmen gemacht und kann so eben

17:58.450 --> 18:03.110
entdecken, wo auf Gebäudedächern quasi Wärmebrücken sind.

18:03.970 --> 18:08.350
Und dann haben wir die, bei mir im Institut, im SCC, Forschende im

18:08.350 --> 18:12.270
Bereich der KI, haben da eben quasi eine KI angeworfen und diese

18:12.270 --> 18:15.510
Sachen versucht automatisch zu detektieren.

18:17.210 --> 18:20.810
So viel also von mir zum Thema Daten und KI.

18:21.810 --> 18:24.670
Und quasi wie man auf Englisch immer so sagt, Take away message.

18:25.250 --> 18:28.790
Was können Sie heute Abend nach Hause nehmen von diesem Vortrag?

18:29.410 --> 18:33.110
Wir als SCC sind einerseits das Rechenzentrum, aber vor allen Dingen

18:33.110 --> 18:35.890
das forschende Rechenzentrum des KIT.

18:36.730 --> 18:40.550
Und seit mehr als 20 Jahren beschäftigen wir uns mit großen Daten, mit

18:40.550 --> 18:45.750
wirklich großen Datenmengen, nämlich 15% aller LHC-Daten, können Sie

18:45.750 --> 18:50.330
sich auch merken, liegen hier bei uns in Karlsruhe in Kritka.

18:51.290 --> 18:55.150
Vielen Dank für die Aufmerksamkeit und jetzt übergebe ich glaube ich

18:55.150 --> 18:56.750
zurück an den Bürgermeister.

