CCU Gerätekommunikation gestört – Fehlersuche (Teil 2)

Fehlersuche CCU3

Im zweiten Teil meiner Fehlersuche geht es nun um die Suche nach möglichen Hardwarefehlern. Bei meinen Recherchen habe ich immer wieder gelesen, die Geräte alle neu anzulernen und somit den Fehler einzugrenzen. Da dies ein enormer Aufwand ist habe ich vorab versucht, Kandidaten für das neue Anlernen einzugrenzen. Darauf beziehen sich die folgenden Schritte. Hier sind natürlich weitere Tests und andere Reihenfolgen möglich.

Aufgabenstellung

Wie im ersten Teil erläutert erhielt ich immer mehr Fehlermeldungen von verschiedenen Aktoren "Gerätekommunikation gestört". Manche dieser Servicemeldungen verschwanden wieder nach kurzer Zeit automatisch. Nach verschiedenen Neustarts der CCU meldeten sich aber immer wieder neue Aktoren mit dieser Fehlermeldung, während andere Aktoren nach einem Neustart die vorher gemeldete Kommunikationsstörung nicht mehr aufführten. Da ich viele der Aktoren auch in Programm z.B. über openHAB anspreche hatten einige dieser Meldungen durchaus unangenehme Auswirkungen. So bleiebn z.B. nur die Rolladenaktoren oben oder unten, die gerade keine Kommunikationsstörung hatten. Da der Fehler schleichend aufgetreten war, gab es keine konkreten Vermutungen, woher dieser kommen konnte. Im ersten Teil habe ich zumindest offensichtliche Softwarefehler ausschließen können.

Duty Cylce beobachten

In einem ersten Schritt empfiehlt sich, alle kürzlich in Betrieb genommenen Geräte (Aktoren und Sensoren) wieder außer Betrieb zu nehmen und das anschließende Verhalten zu prüfen (ich empfehle hier einen Zeitraum von 4 Wochen vor einer Identifikation des Fehlers bzw. wenn klar ist wann der Fehler aufgetreten ist alles, was innerhalb von 2 Wochen vorher installiert wurde.) Sofern der Fehler nicht wieder auftritt, sollten die Geräte anschließend sukzessive erst wieder in Betrieb genommen werden. Ich warte i.d.R. 2 Tage nach einer neuen Geräteinstallation ab, ob sich ein Auffälliges Verhalten zeigt. Auch kann einer hoher Duty Cycle darauf hindeuten, dass es Geräte gibt die überproportional viel "funken" und daher andere Geräte stören oder von einer geregelten Kommunikation abhalten. Dies findet man durch die Analyse von Statusmeldungen heraus bzw. wenn mann die Gerätekommunikation protokolliert (Protokoll sollte dann in den Geräte aktualisiert sein). Ganz unten habe ich dazu noch eine Möglichkeit gefunden, die Telegram Kommunikation sichtbar zu machen.  In meinem Fall war der Duty Cycle in einem "normalen" Bereich bei durchschnittlich ca. 10%, so dass ich hier erstmal nicht weitergeforscht habe.

Zum Duty Cylce gibt es auch in dem Blog von Christian Lütgens gute Hinweise.

Signalstärke prüfen

Es stellt sich als erste Frage, ob die Komponenten gut erreichbar sind. Hier gibt es eine kleine schicke Software für eine erste Indikation. Installiert Euch dazu das Programm Homematic Manager aus dem gleichnamigen GitHub Projekt. Nach der Eingabe der IP-Adresse der CCU listet der Homematic Manager viele Details zu den Geräten auf und ermöglicht auch einfache Massenänderungen.

Achtet bitte darauf, dass Ihr als erstes oben links im Fenster das richtige Geräteprotokoll wählt, damit Ihr die entsprechenden Geräte angezeigt bekommt. Unter dem Reiter "Funk" wird nun für Hin- und Rückkanal zu jedem Gerät (teilweise erst nach einiger Zeit, wenn sich alle Geräte gemeldet haben) die Signalstärke angezeigt wird. Hieraus wird schnell erkennbar, ob ihr ein systematische Problem mit einem Gerät haben könntet.

Sofern hier ganze Gerätegruppen nur schlecht erreichbar sein sollten, kann das ein Indikator für eine nicht ausreichende Signalabdeckung sein. In diesem Fall kann der Standort der CCU verändert oder ein Repeater (z.B. die Funksteckdosen) eingesetz werden, um die Abdeckung zu vergrößern.

Kommunikation prüfen

Ich habe anschließend die Statuskommunikation zwischen CCU3 und ausgewählten Aktoren oder Sensoren gecheckt (Kandidaten aus dem vorigen Test sowie Geräte mit einer Servicemeldung). Die Verbindung zwischen Gerät und CCU3 ist bidirektional. D.h. die CCU3 kann möglicherweise keine Befehle senden, aber das Gerät ist z.B. in der Lage seine Statusinformationen korrekt zu übermitteln (oder umgekehrt). Dies merkt Ihr daran, dass in der CCU die Eigenschaften des Gerätes ständig aktualisiert werden, obwohl die CCU eine Servicmeldung "Gerätekommunikation gestört ausgegeben hat". In diesem Fall ist die Kommunikation von der CCU zum Gerät gestört, nicht aber umgekehrt.  Wenn also nur eine unidirektionale Kommunikationsstörung vorliegt, dann sollte in einem nächsten Schritt die Signalstärken kontrolliert werden (zeige ich weiter unten, wie das geht).

Die Verbindung von der CCU zum Aktor oder Sensor kann durch Drücken des Test Buttons unter Einstellungen /Geräte in der WebUI initiitert werden.

Wenn eine bestehende Servicemeldung nun aufgehoben wird, dann ist zumindest eine Verbindung zwischen CCU3 und dem Gerät prinzipiell noch möglich.

Drückt für die umgekehrte Richtung testweise auf den HMIP-Button des Gerätes oder löst eine zu messende Aktion am Sensor oder Aktor aus. Meldet das Gerät durch rotes Blinken einen Fehlercode, dann solltet Ihr dies kurz in der Anleitung zum Gerät bzgl. der Fehlermeldungen prüfen. I.d.R. bedeutet ein einmaliges rotes Blinken, dass die aktuelle Gerätekommunikation vom Gerät zur CCU gestört.

Nach diesen Tests ergaben sich bei mir zwie Fenstersensoren sowie ein Bewegungsmelder als heiße Kandidaten.

Ist die Batterie leer?

Insbesondere wenn das Gerät keine Meldungen abschicken kann, dann kann es auch an der Batterie liegen.

Eigentlich sollte die CCU eine Warnmeldung generieren, wenn der bei einem Gerät definierte Schwellwert bzgl. der Batteriespannung erreicht oder unterschritten wird.  Allerding ist dies ein eingestellter Wert, d.h. tatsächlich könnte der Wert zu niedrig eingestellt sein und daher für die Sendeleistung nicht ausreichen. Also solltet das mal kurz geprüft werden, ob bei kritischen Geräten die Batterie eine Rolle spielen könnte (Rolladenaktoren und fest verdrahtetet Schalter gehören nicht zu dieser Gruppe).  Wenn also die Signalstärke vom Gerät zur CCU schwach ist oder eine biderektionale schwache Signalstärke vorliegt oder das Gerät immer wieder per roter Signallampe einen Kommunikationsstörung zur CCU meldet oder gar nichts mehr blinkt, wenn Ihr den Aktor betätgt, dann solltet Ihr zur Sicherheit mal die Batterien tauschen.  Bei meinem Versuchen mit den möglichen Geräten hat dies leider nichts gebracht.

Geräte neu anlernen

Mit diesem Punkt habe ich mich am meisten schwer getan, denn man setzt nicht mal so einfach einen Rolladenaktor stromlos, steigt aufs Dach, um einen Wetterstation stromlos zu machen oder geht die anderen 100 Geräte einzeln durch. Daher bin ich so vorgegangen, erst die Singalstärken der Geräte von und zur CCU zu prüfen und die Geräte genauer anzuschauen, die eine schwache Signalstärke in ein der beiden Richtungen anzeigen. Achtet bitte dabei unbedingt auf folgendes: Die alten Geräte müssen vor einem neuen Anlernen "abgelernt" werden. D.h. sie sollten aus der CCU3 gelöscht und anschließen am Gerät auf die Werkseinstellung gesetzt werden. Wenn man das so nicht macht, dann bleibt u.U. die alte Konfiguration partiell am Leben und stört weiter das große System.

Und hier habe ich tatsächlich meine Fehlerquelle gefunden. Ein Bewegungsmelder führte nach einem Zurücksetzen auf die Werkseinstellungen zu einem sechsmaligen Blinken. Und dieser Code gibt an, dass nach einem Selbsttest des Gerätes ein Fehler vorliegt. D.h. nach dem Entfernen des Gerätes aus der CCU3 und dem stromlosschalten des Gerätes wurden keine Fehler mehr gemeldet. Seitdem läuft alles wieder prima.

CCU3 defekt?

Dieses Szenario habe ich nicht testen müssen, würde aber wie folgt vorgehen. Wenn alle Softwaretests auf der CCU sowie die Hardwartests wie oben beschrieben nicht zum Erfolg führen würden, würde ich nach einem Backuo die XCCU auf Standardeinstellungen zurücksetzen und beginnen, die Geräte wieder anzulernen. Tritt hier bei ständiger Beobachtung wieder der Fehler systematisch auf, würde ich eine alternative HArdware beschaffen und dann dort den Aufbau neu betreiben.

Test der Funkabdeckung

Bei meiner Suche bin ich auch auf folgende nützliche Hinweise gestoßen. Wer eine große Fläche mit einer CCU abdecken muss, der verwendet Repeater oder mehrere CCUs um diese Bereiche für einen guten Empfang abzudecken. Es bleibt allerdings eine Kunst, den genauen Standort für die Empfangs- und Sendestationen zu finden. Eine zu große Überdeckung sollte aufgrund von Interferenzen nicht stattfinden.

Ein nützliches Gerät biete hierfür ELV an, der ELV Funk-Analyser EQ3-RFA, 868MHz für Homematic IP, Homematic und MAX!

Mit diesem kann man testen, bis wo Funksignale empfangen / Gesendet werden können.

Eine netten Beitrag hierzu findet Ihr auch auf technikkram.net

Ein weiteres erwähnenswertes Projekt ist in diesem Zusammenhang der Asksin Analyzer XS. Hierbei werden auch die Homeatic Telegramme anylsiert. Wenn man die Decodierer nicht selbar bauen möchet findet man über das GitHub Forum auch fertig zusammengelötetet USB-Platinen, z.B. auf eBay.

Störeinflüsse durch FritzBox

Zuallerletzt habe ich noch ein mögliches Problem für die Kommunikationsfehler feststellen können. Eine Fritzbox kann, wenn sie direkt neben einer CCU oder einem Access Point installiert ist, Störeinflüsse erzeugen. Dies muss nicht notwendigerweise durch die WLAN Antenen sein, sondern kann z.B. auch durch ein Kabelmodem verursacht werden. Da ich kein Elektrotechniker bin kann ich nur vermuten, dass es hier Frequenzüberlagerungen gibt, die auch das Funkprotokoll der CCU im 866 Mhz Bereich stören kann. Auf jeden Fall hat bei verschiedenen Tests die räumliche Trennung von Fritzbox und CCU3 wesentlich weniger Verbindungsstörung zwischen CCU und Endgeräten ermöglicht.