Attention : ce billet est méthodologiquement à la fois expérimental et sans doute discutable. À utiliser donc avec précaution… Previously on Parcoursup Ce post est la suite d’un précédent billet qui présente l’utilisation d’UMAP comme méthode de réduction de dimensionnalité appliquée aux données de la campagne 2018 de Parcoursup. Vous pouvez vous y référer pour avoir un aperçu du jeu de données et une brève (et peu convaincante) explication du fonctionnement d’UMAP.

Continue reading

Attention : ce billet est méthodologiquement à la fois expérimental et sans doute discutable. À utiliser donc avec précaution… Parcoursup ? Les données concernant l’offre de formations et les voeux effectués dans le cadre de la session 2018 de Parcoursup ont été mises en ligne récemment. Le jeu de données contient une ligne par formation, avec les caractéristiques de cette formation (établissement, type, filière…) et un certain nombre d’indicateurs sur les voeux effectués pour cette formation et le processus d’admission1.

Continue reading

What is drake ? drake is an R package which provides a way to organise and optimize your data analysis projects. For developers, it is an equivalent of GNU Make for R. With drake, you define your project as a plan with several steps (data import, data munging, analysis, reporting…). At any time you can re-run your entire plan in a clean R environment, ensuring reproducibility. Better yet, drake looks for and takes into account dependencies between your steps, thus running only the ones needed.

Continue reading

Protocol There are several reasons why you would want to save a data frame to a file : sending it or putting it online for further work or public sharing temporarily store long computation results for further use In each case, your tradeoff between execution time and resulting file size will be different. When used locally, time taken to write and read is crucial.

Continue reading

Author's picture

Julien Barnier

Sometimes I do things

R user

Lyon, France