Forum

You are not logged in.

#51 28-12-2009 18:25:28

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,559
Website

Re: Nouvelle architecture : infos et avancement

Voici les nouvelles :

- le problème « Too many open files » est résolu, il ne s'agissait pas d'un leak ;

- quelques améliorations ont été apportées sur le proxy pour augmenter sa robustesse. J'ai encore un bug rarissime (environ 1 occurrence sur 500 000 requêtes environ) à élucider ;

- la beta se comporte toujours très bien, j'ai étendu sa portée aujourd'hui à davantage de comptes ;

- je préfère repousser le lancement de la beta publique à la semaine prochaine. Tout le monde a la tête ailleurs pendant cette semaine entre Noël et le jour de l'an big_smile et cela me laissera encore un peu de temps pour corriger les deux ou trois choses qui manquent.

Offline

#52 05-01-2010 16:19:56

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,559
Website

Re: Nouvelle architecture : infos et avancement

Bonjour,

Une poignée de bugs rarissimes ont été corrigés, dont l'un grâce à l'aide précieuse de mylab, merci à lui. Il reste d'autres bugs rarissimes (impactant généralement une requête sur plusieurs millions) que j'ai le plus grand mal à élucider, puisque je ne peux pas les reproduire.

En dehors de cela, le proxy est tout à fait stable et fonctionnel - je rappelle qu'il tourne avec l'architecture finale depuis 2 semaines sur certains comptes. Sauf problème de dernière minute, je démarrerai donc la beta publique jeudi.

Si vous êtes volontaire, indiquez-le moi ici (ou en privé si vous préférez). Les avantages immédiats de cette nouvelle architecture sont :

- logs d'accès et d'erreur (enfin big_smile), en temps réel ;
- support des wildcard domains.

Naturellement, la nouvelle architecture apportera à terme bien d'autres bénéfices, mais pour le moment ce sont les seuls.

Les risques de problèmes pour les beta-testeurs sont faibles, mais non nuls. Autrement dit, si la stabilité de votre site est cruciale, ne vous lancez pas.

Aux victimes des erreurs 404 aléatoires : je dirais que les chances de disparition de ce bug avec la nouvelle architecture sont de 50 %. Devenir beta-testeur peut donc être un moyen d'améliorer la stabilité de votre site ; à vous de voir.

Offline

#53 05-01-2010 17:24:18

shaitan
Membre
Registered: 29-04-2009
Posts: 128

Re: Nouvelle architecture : infos et avancement

Bonjour, je suis volontaire pour le site http://passion-xbmc.org

(et je viens de me prendre une erreur "connection fermée par le serveur distant" à l'instant, en éditant ce message.)

Last edited by shaitan (05-01-2010 17:25:20)

Offline

#54 05-01-2010 18:23:54

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,559
Website

Re: Nouvelle architecture : infos et avancement

shaitan wrote:

(et je viens de me prendre une erreur "connection fermée par le serveur distant" à l'instant, en éditant ce message.)

Ça me laisse perplexe neutral

Offline

#55 05-01-2010 18:25:55

shaitan
Membre
Registered: 29-04-2009
Posts: 128

Re: Nouvelle architecture : infos et avancement

Oui, et j'ai rencontré exactement la même erreur deux minutes plus tard sur mon forum.

Offline

#56 05-01-2010 18:29:09

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,559
Website

Re: Nouvelle architecture : infos et avancement

Intéressant. Ça vous l'a déjà fait auparavant, notamment au cours du dernier mois (depuis la mise en place du proxy) ? Vous n'avez pas de problèmes de connexion par ailleurs (je tente, on ne sait jamais...) ?

Offline

#57 05-01-2010 18:43:45

jmsche
Membre
Registered: 05-11-2009
Posts: 138
Website

Re: Nouvelle architecture : infos et avancement

Je suis de la partie smile
Mon compte : jmsche.fr

Offline

#58 05-01-2010 19:20:45

shaitan
Membre
Registered: 29-04-2009
Posts: 128

Re: Nouvelle architecture : infos et avancement

Cyril wrote:

Intéressant. Ça vous l'a déjà fait auparavant, notamment au cours du dernier mois (depuis la mise en place du proxy) ? Vous n'avez pas de problèmes de connexion par ailleurs (je tente, on ne sait jamais...) ?

Non, je ne me souviens pas d'avoir rencontré cette erreur sur mon site auparavant.  Mais sur un ou deux sites en surfant ces dernières semaines, oui, donc effectivement cela peut provenir d'ailleurs.

Offline

#59 05-01-2010 21:38:05

NiCoS
Membre
From: Fontenay le Fleury (78)
Registered: 16-09-2008
Posts: 141
Website

Re: Nouvelle architecture : infos et avancement

Je veux bien être de la partie : compte "nsteinmetz"  cool

Offline

#60 06-01-2010 10:07:12

YvesTan
Membre
Registered: 06-05-2009
Posts: 33

Re: Nouvelle architecture : infos et avancement

J'aurais testé avec plaisir, mais mes clients ne sont pas assez joueur wink

En tout cas, merci de nous tenir au courant de l'avancement des travaux !

Offline

#61 06-01-2010 17:07:58

aurel
Membre
Registered: 21-09-2008
Posts: 15

Re: Nouvelle architecture : infos et avancement

je veux bien tester aussi, mon compte : bewiiz.

merci

Offline

#62 07-01-2010 11:18:41

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,559
Website

Re: Nouvelle architecture : infos et avancement

Les 4 volontaires sont passés en beta depuis 11h15.

Si vous constatez la moindre anomalie, même minime, prévenez-moi. Normalement, vous ne devriez voir aucun changement, ni en mieux ni en moins bien (en dehors des nouvelles fonctionnalités listées dans mon message précédent).

Offline

#63 07-01-2010 11:58:25

brutasse
Membre
Registered: 23-11-2009
Posts: 17

Re: Nouvelle architecture : infos et avancement

Cyril wrote:

Les 4 volontaires sont passés en beta depuis 11h15.

Si vous constatez la moindre anomalie, même minime, prévenez-moi. Normalement, vous ne devriez voir aucun changement, ni en mieux ni en moins bien (en dehors des nouvelles fonctionnalités listées dans mon message précédent).

Bonjour,

Je suis volontaire aussi ! J'ai un script qui parse mes logs et m'envoie un mail tous les jours avec les éventuels problèmes (et j'ai l'erreur 404 aléatoire une douzaine de fois par jour pour un millier de requêtes), donc pas de problème pour faire remonter les améliorations :-)

Merci !

(mon compte : brutasse)

Offline

#64 07-01-2010 12:11:02

NiCoS
Membre
From: Fontenay le Fleury (78)
Registered: 16-09-2008
Posts: 141
Website

Re: Nouvelle architecture : infos et avancement

Cyril wrote:

Les 4 volontaires sont passés en beta depuis 11h15.

Si vous constatez la moindre anomalie, même minime, prévenez-moi. Normalement, vous ne devriez voir aucun changement, ni en mieux ni en moins bien (en dehors des nouvelles fonctionnalités listées dans mon message précédent).

Aucun pb pour moi pour le moment smile

Offline

#65 07-01-2010 12:18:46

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,559
Website

Re: Nouvelle architecture : infos et avancement

OK, je viens de vous rajouter à l'instant.

Je suis justement en train d'étudier cette erreur 404, maintenant que j'ai les outils pour. NiCoS est une des victimes régulières de ce bug à en juger par les logs d'accès à son site (les erreurs sont simples à repérer et sont de la forme : GET /alwaysdata/domains/...).

Or j'ai déjà eu une occurrence du bug sur le compte de NiCoS depuis son passage en beta. Première réaction : déception, la nouvelle archi ne corrige pas le bug...

Sauf que ce n'est peut-être pas aussi simple que cela. Tout d'abord, sur l'ancienne architecture le chemin '/alwaysdata/domains/...' avait une logique : c'était le vrai « docroot » de chaque vhost (à cause de mod_vhost_alias). Je ne connais pas l'origine du bug, mais que le docroot apparaisse dans les logs n'a rien d'inconcevable.

Sur la nouvelle architecture, plus de mod_vhost_alias, les vhosts sont déclarés « normalement » au moyen de directives Apache normales. Le docroot est désormais de la forme : '/home/user/www/...'. Il n'y a donc plus aucune référence au chemin /alwaysdata/domains/..., mais alors comment diable peut-il toujours apparaitre dans les logs ?! D'où Apache le sort-il ?

En regardant avec attention les logs de NiCoS, on se rend compte qu'un certain nombre de ces erreurs sont causées par des crawlers de tous genres. Et l'erreur que j'ai repérée depuis ce matin était justement celle d'un crawler. J'en suis à me demander si certains crawlers au moins n'ont pas gardé ce lien 404 en mémoire et le revisitent régulièrement, pensant qu'il s'agit d'une vraie page.

Bref, pas mal d'interrogations, je suis peut-être complètement à côté de la plaque. J'attends d'autres erreurs 404 avec un user-agent qui ne soit pas un crawler ; si j'en ai, c'est mauvais signe. Si je n'en ai pas, c'est bon signe. NiCoS en ayant plusieurs par jour, on devrait rapidement être fixé.

brutasse : à quoi ressemble votre script ? Un simple 'grep alwaysdata/domains' sur vos logs de 2010 ne me donne aucune occurrence.

Offline

#66 07-01-2010 13:53:18

brutasse
Membre
Registered: 23-11-2009
Posts: 17

Re: Nouvelle architecture : infos et avancement

Cyril wrote:

OK, je viens de vous rajouter à l'instant.

Merci :-)

Cyril wrote:

brutasse : à quoi ressemble votre script ? Un simple 'grep alwaysdata/domains' sur vos logs de 2010 ne me donne aucune occurrence.

Dans mon cas, je n'ai que des applis Django (en 1.1). Et effectivement les erreurs n'apparaissent pas directement dans les logs Apache. Voilà comment j'imagine que ça se passe :

* Le client fait une requête (GET / par exemple)

* mod_vhost_alias réécrit la requête et ajoute /alwaysdata/domains/... je ne sais pas exactement comment ça se passe, mais il transmet la requête à mon appli Django.

* La plupart des cas, Django intercepte la requête correctement et renvoie la réponse correspondante à l'url demandée ('/' dans ce cas). Dans un cas sur 100 environ, Django reçoit une requête qui aurait été mal "réécrite" par mod_vhost_alias, et cherche quelque chose qui matche "/alwaysdata/domains/...<etc>...". Comme je n'ai pas d'URL définie pour ce pattern dans mon appli, Django revoie une erreur 404.

* Apache loggue la réponse avec l'URL qu'il a reçu ('/') et la réponse de Django (200 ou 404).

Je me suis rendu compte de ça en affichant request.get_full_path() dans mon template d'erreur 404 : il m'affiche effectivement "page non trouvée pour l'URL /alwaysdata/domains/...", mais c'est quelque chose qui n'apparait pas dans les logs.

Ce qui est bizarre, c'est que l'erreur apparaisse directement dans les logs de NiCoS. C'est des applis Django aussi ?

Je rencontre cette erreur moi-même, avec un navigateur qui n'est pas un crawler. Quand je tombe sur une erreur 404, je rafraichis la page et tout fonctionne bien.

Mon script d'analyse de logs est ici : http://dpaste.com/hold/142047/. J'ai l'impression que le format des logs change avec l'architecture, donc je vais devoir le mettre à jour... Le script ne fait pas de traitement particulier, mais les erreurs 404 que j'ai sont soit des /robots.txt qui n'existent pas, soit des robots posteurs de commentaires, soit des URLs qui existent et qui renvoient 404 tout de même.

Je me suis demandé si ce n'était pas un problème qui apparaissait lorsqu'une requête est faite et que le processus fcgi n'est pas lancé, mais non... C'est quelque chose qui est périodique (je n'en ai jamais 2 à la suite), mais je n'arrive pas à trouver de logique dans tout ça.

Je ne réponds pas instantanément mais je reste dans le coin, c'est intéressant... J'espère que ça aide à y voir plus clair.

Offline

#67 07-01-2010 14:44:45

NiCoS
Membre
From: Fontenay le Fleury (78)
Registered: 16-09-2008
Posts: 141
Website

Re: Nouvelle architecture : infos et avancement

Cyril wrote:

Je suis justement en train d'étudier cette erreur 404, maintenant que j'ai les outils pour. NiCoS est une des victimes régulières de ce bug à en juger par les logs d'accès à son site (les erreurs sont simples à repérer et sont de la forme : GET /alwaysdata/domains/...).

Or j'ai déjà eu une occurrence du bug sur le compte de NiCoS depuis son passage en beta. Première réaction : déception, la nouvelle archi ne corrige pas le bug...

Sur quel type d'url demandée ? Je ne vois rien sur le access-log du jour ?! (mais il me manque des heures de sommeil ;-) )

Offline

#68 07-01-2010 15:18:55

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,559
Website

Re: Nouvelle architecture : infos et avancement

brutasse : mod_vhost_alias ne réécrit pas la requête, il définit « juste » le DocumentRoot dynamiquement (et prenant la valeur /alwaysdata/domains/...). C'est entièrement interne à Apache. En revanche, comme le DocumentRoot fait partie des nombreuses variables envoyées aux applications FastCGI, les tracebacks de Django affichent bien /alwaysdata/domains/. Mais Django lui-même n'utilise pas cette variable (que je sache).

Ça, c'est la théorie. Dans la pratique, ce qui se passe quand on a cette erreur 404 aléatoire c'est que ce chemin interne se retrouve comme étant le path de la requête. Pourquoi ? mystère. En tout cas c'est clairement un bug, et j'espère qu'il se situe au niveau de mod_vhost_alias : en en étant débarrassé (dans la nouvelle archi), le bug disparaitrait avec.

Le format des logs Apache n'est pas censé avoir changé avec la nouvelle architecture ; que voyez-vous comme différence ?

Mais pour revenir à votre script, comment peut-il détecter les erreurs 404 aléatoires s'il se base sur les logs Apache ?

NiCoS : je fais juste un :

zgrep alwaysdata/domains /home/nsteinmetz/admin/log/2010/access-2010-01-07.log.gz

Toujours pas de requête 404 non crawler, touchons du bois big_smile

Offline

#69 07-01-2010 20:06:13

brutasse
Membre
Registered: 23-11-2009
Posts: 17

Re: Nouvelle architecture : infos et avancement

Cyril wrote:

brutasse : mod_vhost_alias ne réécrit pas la requête, il définit « juste » le DocumentRoot dynamiquement (et prenant la valeur /alwaysdata/domains/...). C'est entièrement interne à Apache. En revanche, comme le DocumentRoot fait partie des nombreuses variables envoyées aux applications FastCGI, les tracebacks de Django affichent bien /alwaysdata/domains/. Mais Django lui-même n'utilise pas cette variable (que je sache).

Ça, c'est la théorie. Dans la pratique, ce qui se passe quand on a cette erreur 404 aléatoire c'est que ce chemin interne se retrouve comme étant le path de la requête. Pourquoi ? mystère. En tout cas c'est clairement un bug, et j'espère qu'il se situe au niveau de mod_vhost_alias : en en étant débarrassé (dans la nouvelle archi), le bug disparaitrait avec.

Merci pour l'explication. Dans tous les cas, pas de 404 jusque maintenant pour moi :-)

Cyril wrote:

Le format des logs Apache n'est pas censé avoir changé avec la nouvelle architecture ; que voyez-vous comme différence ?

En fait, c'est pour le log d'hier... Normalement j'ai des lignes comme ça :

lolify.org <ip> - - [05/Jan/2010:22:36:31 +0100] "GET / HTTP/1.1" 200 20 <referer> <user-agent>

Et dans le log du 6 janvier (qui n'est arrivé que vers 14h) :

cyril - 2109 - 2001 - 87.98.168.77 - 8080 -  | lolify.org <ip> - - [06/Jan/2010:21:46:14 +0000] "GET / HTTP/1.1" 200 (etc etc...)

C'est redevenu normal aujourd'hui.

Cyril wrote:

Mais pour revenir à votre script, comment peut-il détecter les erreurs 404 aléatoires s'il se base sur les logs Apache ?

Il ne fait que me dire quelles sont les erreurs 404 du jour, et je vois directement si la page existe ou non, il n'y a rien de très malin derrière. C'est juste pratique pour avoir un rapport automatique tous les jours.

Je continue aussi de toucher du bois, ça se passe plutôt bien :-)

Offline

#70 07-01-2010 20:33:06

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,559
Website

Re: Nouvelle architecture : infos et avancement

Oups, le format de log que vous avez eu pour la journée d'hier était une boulette de ma part big_smile C'est corrigé, j'ai regénéré les logs de la veille.

Explication : les premiers champs (avant le |) n'auraient pas dû apparaître dans les logs utilisateurs et ne sont destinés qu'aux logs serveurs. Ils apportent des informations sur l'utilisateur vers lequel la requête a été destinée (ainsi que des infos sur l'instance Apache : port et IP d'écoute, UID, GID). Ce que vous voyez (cyril, 87.98.168.77:8080) correspond simplement au Apache global qui héberge tout le monde (sauf les beta-testeurs).

Voilà, rien de bien méchant ni de sensible.

Pour les 404, tenez-moi au courant de la situation si vous en voyez apparaitre. Toujours rien chez NiCoS (mon baromètre smile), cela semble de bon augure.

Offline

#71 08-01-2010 01:27:45

shaitan
Membre
Registered: 29-04-2009
Posts: 128

Re: Nouvelle architecture : infos et avancement

Aucune erreur 404 depuis le basculement sur la nouvelle architecture.
Ca me manquerait presque  lol

Offline

#72 08-01-2010 10:45:28

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,559
Website

Re: Nouvelle architecture : infos et avancement

Après bientôt 24h de beta, tout semble indiquer que les bugs 404 ont disparu. Reste à voir si leur fréquence a drastiquement diminué, comme en septembre après la migration serveur, ou si le bug a bel et bien été éradiqué. Nous verrons bien sur le long terme.

shaitan : si cela se confirme, c'est une double bonne nouvelle. Vos erreurs 404 ont toujours été un peu différentes, par leur manifestation, que les autres. Je n'étais donc pas certain qu'il s'agissait du même problème ; apparemment oui.

La migration générale vers la nouvelle architecture devrait intervenir dans la semaine du 18 janvier, sauf si des bugs se manifestent avant.

Par ailleurs, un redémarrage du serveur HTTP est programmé dans la nuit du dimanche 17 janvier vers 1h du matin. Sauf problème, cela ne devrait occasionner qu'une coupure d'environ 3 minutes. Raison : une mise à jour du kernel doit être faite avant que tout le monde bascule sur la nouvelle architecture.

Offline

#73 08-01-2010 23:10:49

shaitan
Membre
Registered: 29-04-2009
Posts: 128

Re: Nouvelle architecture : infos et avancement

Cyril wrote:

shaitan : si cela se confirme, c'est une double bonne nouvelle. Vos erreurs 404 ont toujours été un peu différentes, par leur manifestation, que les autres. Je n'étais donc pas certain qu'il s'agissait du même problème ; apparemment oui.

Même si c'est encore un peu tôt pour être absolument affirmatif, il semble bien que oui, les erreurs 404 appartiennent au passé. Leur fréquence était redevenue assez importante il y a quelques jours. Et là, plus rien.
Vous avez travaillé longuement à ce projet très complexe qui va nous permettre bien des choses à terme. ( et qui permettent déjà d'utiliser quelques nouveautés plutôt sympathiques). Vous ne craignez pas de développer en interne des solutions novatrices et nous en bénéficierons tous. L'année commence bien et j'ai dans l'idée qu'elle sera fertile en nouveauté chez Alwaysdata. Quand à nous, (je parle au nom de ma communauté cette fois), nous bénéficions désormais d'un confort que nous n'avons pas connu chez aucun des nombreux hébergeurs que nous avons essayés ces deux dernières années, alors un grand merci et continuez comme ça.

Last edited by shaitan (08-01-2010 23:11:52)

Offline

#74 08-01-2010 23:25:50

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,559
Website

Re: Nouvelle architecture : infos et avancement

Merci pour ces encouragements. Entre la nouvelle architecture et la migration des serveurs de l'année dernière, cela fera bientôt 9 mois nous travaillons « dans l'ombre » ; j'ai hâte de reprendre de nouveaux développements. Vous avez raison, ce premier semestre 2010 devrait être l'un des plus fertiles depuis la naissance d'alwaysdata.

Offline

#75 09-01-2010 00:30:07

NiCoS
Membre
From: Fontenay le Fleury (78)
Registered: 16-09-2008
Posts: 141
Website

Re: Nouvelle architecture : infos et avancement

Cyril wrote:

NiCoS : je fais juste un :

zgrep alwaysdata/domains /home/nsteinmetz/admin/log/2010/access-2010-01-07.log.gz

Toujours pas de requête 404 non crawler, touchons du bois big_smile

Ok, me manquait juste le zgrep - en copiant le fichier de log ailleurs pour le lire, il me sortait une erreur...

D'ailleurs :

nsteinmetz@ssh:~$ zgrep alwaysdata/domains /home/nsteinmetz/admin/log/2010/access-2010-01-08.log.gz 

gzip: /home/nsteinmetz/admin/log/2010/access-2010-01-08.log.gz: invalid compressed data--format violated
nsteinmetz@ssh:~$ zgrep alwaysdata/domains /home/nsteinmetz/admin/log/2010/access-2010-01-09.log.gz 

gzip: /home/nsteinmetz/admin/log/2010/access-2010-01-09.log.gz: unexpected end of file

Pas de pb pour les logs du 7.

Offline

Board footer

Powered by FluxBB