On Thu, Sep 14, 2023 at 06:01:46PM +0000, Pierre Parrend wrote:
* Marc: ‘OpenBSD Ports and Packages: making
things faster and easier’
Perso, ca sera pas ca.
Le sujet en question a deja ete raconte en LT l'an dernier + summer week
pour la partie perl.
Faut que je trouve un titre, mais j'ai plein de choses a raconter sur
la recup' de fichiers sources a droite/a gauche (x10000)
Cote PFA ou autre, j'espere relancer le "Copy-peste": recherche de
ressemblances sur les 10000+ archives de ports d'OpenBSD (l'idee etant
que beaucoup de projets copient-collent d'autres archives, bug compris).
Je vais donner les billes pour exploiter sqlports, notre db de fichiers
d'archive a recuperer.
Par contre, je sais pas trop ce qu'il faut faire pour trouver des fichiers
identiques/proches sur 10000 archives contenant plusieurs centaines de
fichiers identiques (idee initiale: trouver un truc "supervise" qui retrouve
des copies de zlib ou libjpeg... et voir si on sait faire un truc similaire
en mode non supervise. Si on sait faire on peut s'en servir pour trouver
automatiquement des copies de CVE dans d'autres projets)
C'est un peu de l'IA, cote analyse big data. J'ai les competences metier,
mais pas la moindre idee de comment il faut faire pour l'aborder.
L'enjeu est reel: les bugs sur un logiciel qui "se propagent" sur
d'autres
logiciels qui utilisent le meme code par couper-coller est un probleme
tout ce qu'il y a de plus concret!
En premiere approximation, etre capable de quantifier tout cela (quelles
metriques?) serait deja super-utile!
(c'est une sorte de serpent de mer, je ne sais pas du tout comment
faire ce genre de choses sur les tailles de donnees considerees)
______________________
Secu-sys.perms mailing list -- secu-sys.perms(a)ml.lre.epita.fr
https://lists.lrde.epita.fr/postorius/lists/secu-sys.perms.ml.lre.epita.fr//