Révision cb3752a0
b/papers/2013/Climate-Paper/paper.tex | ||
---|---|---|
45 | 45 |
Cependant, si ce nouveau modèle convient à la plupart des usages, certains d'entre eux, tels que le HPC, sont difficilement transposables dans le cloud à l'heure actuelle. |
46 | 46 |
En effet, les applications HPC sont très gourmandes en ressources, et très sensibles à toute variation de performances entre les noeuds de calcul. |
47 | 47 |
Il faut donc avoir une homogénéité des noeuds en terme de CPU / GPU, mais aussi de réseau (bande passante, latence). Cette homogénéité évite que les noeuds les plus lents ralentissent les plus rapides. |
48 |
Il faut aussi veiller à ce que l'activité des autres utilisateurs ne perturbe pas les jobs HPC. Pour cela, un utilisateur doit pouvoir réserver des machines, et la portion de réseau utilisée entre elles, afin d'éliminer toute perturbation.
|
|
48 |
Il faut aussi veiller à ce que l'activité des autres utilisateurs ne perturbe pas les tâches HPC. Pour cela, un utilisateur doit pouvoir réserver des machines, et la portion de réseau utilisée entre elles, afin d'éliminer toute perturbation.
|
|
49 | 49 |
Cette réservation de machine physique, nécessaire dans un contexte HPC, semble aller à l'encontre de la tendance actuelle à la consolidation. Mais c'est sans compter la spécificité des tâches HPC, qui sont très intensives et accaparent souvent toutes les ressources de calcul des machines. Si la consolidation était possible, elle apporterait non pas des avantages (meilleur taux d'usage et meilleur efficacité énergétique), mais au contraire perturberait la performance des applications HPC, au point de rendre leur exécution dans le cloud impossible. |
50 | 50 |
Or, actuellement, les applications HPC sont exécutés sur des infrastructures privées, souvent surdimensionnées, très onéreuses, et rarement exploitées de façon continue à leur plein potentiel. |
51 | 51 |
|
... | ... | |
57 | 57 |
\section{État de l'art} |
58 | 58 |
On s'intéresse ici à la manière de réserver des ressources de calcul. Ces ressources peuvent être virtuelles (des instances avec des caractéristiques données) ou physiques (un noeud de calcul). |
59 | 59 |
|
60 |
Dans cet état de l'art, nous étudierons Amazon EC2, une plateforme célèbre et qui supporte plusieurs modes de réservation d'instances. En la comparant avec d'autres plateformes, et notamment Windows Azure, nous constatons que le modèle de réservation d'Amazon est le plus riche. |
|
61 |
Nous prendrons donc celui-ci pour référence par la suite. |
|
60 |
\subsection{Amazon EC2} |
|
61 |
La plateforme Amazon EC2 propose un système de location de ressources qui convient à beaucoup de cas d'utilisation différents. |
|
62 |
En la comparant avec d'autres plateformes, et notamment Windows Azure, nous constatons que le modèle de réservation d'Amazon est le plus riche. |
|
62 | 63 |
|
63 |
Aucune plateforme commerciale ne supporte la réservation de noeuds physiques. En effet, cela conduirait à dévoiler les caractéristiques de ces noeuds, ce que ne souhaitent pas les fournisseurs. C'est pourquoi les plateformes commerciales n'acceptent pas ce type de réservation. |
|
64 |
En revanche, Grid'5000, une plateforme d'expérimentation scientifique, permet de réserver des noeuds physiques. L'utilisateur est donc dans un environnement single-tenant. |
|
65 |
|
|
66 |
Concernant la manière de préciser les caractéristiques matérielles des hôtes requises, toutes les plateformes, à l'exception de Grid'5000, demandent à l'utilisateur de sélectionner les instances parmi une liste d'instances types (petit, moyen, grand). On parle ici des caractéristiques d'instances, et non pas des caractéristiques des hôtes qui hébergent ces instances. |
|
67 |
Le fonctionnement de Grid'5000 est différent : l'utilisateur réserve non pas des instances, mais des hôtes physiques. Comme l'infrastructure est publique, il n'est pas gênant de dévoiler cette infrastructure et l'utilisateur est autorisé à préciser les caractéristiques matérielles que doivent posséder les hôtes. Ces caractéristiques sont renseignées par les administrateurs de la plateforme, et l'utilisateur peut en obtenir une liste. |
|
68 |
|
|
69 |
Voyons maintenant en détail les instances supportées par Amazon EC2. |
|
70 | 64 |
Amazon fournit quatre types d'instances: à la demande, réservées, ponctuelles, et dédiées (au sein d'un Virtual Private Cloud). |
71 | 65 |
|
72 | 66 |
Les instances à la demande ont un tarif horaire plus élevé que les instances réservées, mais ne nécessitent pas de payement préalable. L'accès au ressources n'est pas garantie en cas de pic de charge. Ce type d'instance convient aux applications à court terme, qui demandent une quantité de resources variable, et qui ne peuvent pas être interrompues. |
73 |
Windows Azure et OVH supportent ces types d'instances.
|
|
67 |
Ce type d'instances est généralement proposé par les fournisseurs de clouds (Windows Azure, etc).
|
|
74 | 68 |
|
75 | 69 |
Les instances réservées demandent à faire un payement préalable (réservation sur un à trois ans). Le taux horaire est ensuite bien plus avantageux. |
76 |
L'accès aux resources est garanti. Ces instances sont parfaites pour les applications stables et prévisibles, ou qui nécessitent une quantité de ressource donnée (récupération après désastre). |
|
77 |
Windows Azure et OVH supportent ces types d'instances.
|
|
70 |
L'accès aux resources est garanti. Ces instances sont parfaites pour les applications stables et prévisibles, ou qui nécessitent une quantité de ressource donnée (récupération après désastre). Les instances réservés peuvent être revendues sur la place de marché Amazon, au prix choisit par le vendeur.
|
|
71 |
Ce type d'instances est aussi très souvent proposé par les fournisseurs de clouds (Windows Azure, etc).
|
|
78 | 72 |
|
79 | 73 |
Les instances ponctuelles permettent à l'utilisateur de préciser le coût maximum horaire qu'il est prêt à payer. Il n'y a pas de payement préalable, et les instances sont tuées si le coût horaire dépasse celui précisé par l'utilisateur (en fonction de l'offre et de la demande). |
80 | 74 |
Ce type d'instance est adapté aux applications avec des dates de début et de fin flexibles, qui ne sont faisable qu'à très bas coût (ces instances sont moins chères que les instances à la demande), ou qui sont très urgentes (ces instances sont utilisées pour rajouter à la volée de la capacité additionnelle). La facturation se faisant à l'heure, la dernière heure "partielle" n'est pas facturée (à moins que l'utilisateur termine volontairement son instance). |
81 |
Seul Amazon EC2 supporte cette fonctionnalité. Le mode best effort de Grid'5000 s'en rapproche (mais il n'y a pas de facturation) : une tâche best effort est tuée si quelqu'un a besoin de la machine sur laquelle elle tourne.
|
|
75 |
À notre connaissance, seul Amazon EC2 supporte cette fonctionnalité.
|
|
82 | 76 |
|
83 | 77 |
Enfin, les instances dédiées sont disponibles dans l'offre Virtual Private Cloud (VPC). Le VPC permet de constuire un pont sécurisé entre l'infrastructure locale (d'une entreprise) et l'insfrastructure Amazon, en passant par un VPN. Les instances à l'intérieur de ce VPC sont isolées des autres instances (au niveau réseau). Par défaut (sans instances dédiées), les instances appartenant à un VPC peuvent être exécutées sur des machines partagées entre plusieurs clients. Pour être certain d'être dans un environnement single-tenant, il faut utiliser des instances dédiées. |
84 | 78 |
On remarquera que plusieurs instances dédiées appartenant au même client ne sont pas forcément lancées sur la même machine, afin de diminuer l'impact en cas de panne matérielle. |
85 |
Ces instances dédiées fournissent un environnement single-tenant, tout comme Grid'5000, où l'utilisateur réserve des noeuds physiques entiers. |
|
86 |
|
|
87 |
OVH permet de réserver des machines dans son offre Dedicated Clouds. Cette offre s'appuie sur vCloud et vSphere de VMware. |
|
88 |
L'utilisateur obtient des ressources dédiées (même le réseau), et il est possible d'ajouter et de supprimer des noeuds à la demande. |
|
89 |
Il existe une dizaine de configurations proposées. La facturation est à l'heure. |
|
90 |
|
|
91 |
Haizea est un système de reservation et de scheduling proposé à l'origine pour OpenNebula. Il supporte différents types de réservations (immédiates, futures et best effort). Il prend en compte les ressources et le temps nécessaire pour préparer la réservation (transfert des images), et celles occupées par les VMs. Ainsi, les réservations peuvent commencer précisément à l'heure requise, et l'utilisateur obtient exactement la quantité de mémoire libre qu'il a demandé. |
|
92 |
|
|
93 |
% citrix |
|
94 |
% ovh |
|
95 |
% OpenNebula: Haizea |
|
96 |
|
|
97 |
% \paragraph{On-demand instances} let you pay for compute capacity by the hour with no long-term commitments or upfront payments. You can increase or decrease your compute capacity depending on the demands of your application and only pay the specified hourly rate for the instances you use. Amazon EC2 always strives to have enough On-Demand capacity available to meet your needs, but during periods of very high demand, it is possible that you might not be able to launch specific On-Demand instance types in specific Availability Zones for short periods of time. |
|
98 |
% |
|
99 |
% On-Demand Instances are recommended for: |
|
100 |
% \begin{IEEEitemize} |
|
101 |
% \item Users that want the low cost and flexibility of Amazon EC2 without any up-front payment or long-term commitment |
|
102 |
% \item Applications with short term, spiky, or unpredictable workloads that cannot be interrupted |
|
103 |
% \item Applications being developed or tested on Amazon EC2 for the first time |
|
104 |
% \end{IEEEitemize} |
|
105 |
% |
|
106 |
% \paragraph{Reserved instances} let you make a low, one-time, upfront payment for an instance, reserve it for a one or three year term, and pay a significantly lower hourly rate for that instance. You are assured that your Reserved Instance will always be available for the operating system (e.g. Linux/UNIX or Windows) and Availability Zone in which you purchased it. For applications that have steady state needs, Reserved Instances can provide savings of up to 71\% compared to using On-Demand Instances. Functionally, Reserved Instances and On-Demand Instances perform identically. See "How to Purchase Reserved Instances" for more information. |
|
107 |
% |
|
108 |
% Reserved Instances are recommended for: |
|
109 |
% \begin{IEEEitemize} |
|
110 |
% \item Applications with steady state or predictable usage |
|
111 |
% \item Applications that require reserved capacity, including disaster recovery |
|
112 |
% \item Users able to make upfront payments to reduce their total computing costs even further |
|
113 |
% \end{IEEEitemize} |
|
114 |
% |
|
115 |
% \paragraph{Spot instances} provide the ability for customers to purchase compute capacity with no upfront commitment and at hourly rates usually lower than the On-Demand rate. Spot Instances allow you to specify the maximum hourly price that you are willing to pay to run a particular instance type. Amazon EC2 sets a Spot Price for each instance type in each Availability Zone, which is the price all customers will pay to run a Spot Instance for that given period. The Spot Price fluctuates based on supply and demand for instances, but customers will never pay more than the maximum price they have specified. If the Spot Price moves higher than a customer’s maximum price, the customer’s instance will be shut down by Amazon EC2. Other than those differences, Spot Instances perform exactly the same as On-Demand or Reserved Instances. See here for more details on Spot Instances. |
|
116 |
% |
|
117 |
% Spot Instances are recommended for: |
|
118 |
% \begin{IEEEitemize} |
|
119 |
% \item Applications that have flexible start and end times |
|
120 |
% \item Applications that are only feasible at very low compute prices |
|
121 |
% \item Users with urgent computing needs for large amounts of additional capacity |
|
122 |
% \end{IEEEitemize} |
|
123 |
% |
|
124 |
% \paragraph{Dedicated} |
|
125 |
% |
|
126 |
% Dedicated instances is available in Virtual Private Cloud (VPC) offerings. Dedicated Instances run on single-tenant hardware. They are physically isolated at the host hardware level from your other instances and instances that belong to other AWS accounts. |
|
127 |
% |
|
128 |
% Reserved instance and dedicated hardware can be combined. Which means that an instance that has been reserved can be launched on single-tenant hardware . This use case is close from the concept of Capacity Leasing Service. A notable difference between the Capacity Leasing Service and AWS is two-fold: |
|
129 |
% |
|
130 |
% \begin{IEEEitemize} |
|
131 |
% \item With AWS, dedicated instance can be launched only into a virtual private cloud (VPC) whereas with the Capacity Leasing Service dedicated hardware is reserved at the project level. If a VPC is created with the instance-tenancy option set to 'dedicated' then all instances are launched as dedicated tenancy instance regardless of the tenancy assigned at launch. |
|
132 |
% \item With AWS dedicated instances are virtual. The Capacity Leasing Service allows to reserve physical machines that could/should be usable to instantiate virtual machines but also physical machines through the bare-metal provisioning extensions of OpenStack Nova. |
|
133 |
% \end{IEEEitemize} |
|
134 |
% |
|
135 |
% The model offered by AWS seems to be quite different than the model proposed by the Capacity Leasing Service in that the combine effect of reserved instance and dedicated tenancy doesn't seem to effectively guarantee the reservation of physical resources. |
|
79 |
Les instances dédiées se rapprochent de la réservation de ressources physiques, à la différence que les caractéristiques de l'hôte physique ne sont pas choisies par l'utilisateur. |
|
80 |
|
|
81 |
\subsection{OVH} |
|
82 |
OVH propose deux offres Dedicated Cloud, qui reposent sur VMware. |
|
83 |
L'offre vSphere as a service propose un cloud dédié, avec une visibilité sur le matériel, tandis que l'offre vCloud as a service fait abstraction du matériel. Une dizaine de configurations serveurs sont proposées, que l'utilisateur peut choisir avec l'offre vSphere as a service. |
|
84 |
Dans tous les cas, il peut rajouter des ressources ou en enlever selon ses besoins. La facturation est à l'heure. |
|
85 |
|
|
86 |
\subsection{Grid'5000} |
|
87 |
Grid'5000 est une plateforme d'expérimentation scientifique, qui diffère des solutions commerciales sur de nombreux points. |
|
88 |
Son infrastructure est publique et l'utilisation gratuite. C'est la seule plateforme parmi celles étudiées ici qui permet de réserver des ressources en avance, et en précisant les caractéristiques des hôtes souhaitées. Toutes les autres plateformes (à l'exception des OVH Dedicated Clouds) font choisir l'utilisateur parmi une liste de "flavors". |
|
89 |
En effet, contrairement aux plateformes commerciales qui sont réticentes à dévoiler leur infrastructure physique, Grid'5000 fournit beaucoup de détails sur les hôtes physiques, ce qui permet à l'utilisateur de les choisir en fonction de leurs propriétés. Les hôtes physiques réservés sont affectés à l'utilisateur au moment de la réservation. |
|
90 |
L'utilisateur se retrouve dans un environnement single-tenant (comme sur un instance dédiée Amazon), à la différence qu'il a pu choisir le matériel sous-jacent. |
|
91 |
Grid'5000 dispose aussi d'un mode best effort, qui ressemble aux instances ponctuelles d'Amazon. La différence est qu'avec Amazon, une instance ponctuelle est interrompue si le prix devient trop élevé, tandis que dans Grid'5000, comme il n'y a pas de facturation, l'instance est tuée si un utilisateur a réservé la machine sur laquelle l'instance best effort est exécutée. |
|
92 |
|
|
93 |
\subsection{Bilan} |
|
94 |
À l'heure actuelle, seul Grid'5000 permet de réserver des ressources à l'avance, avec des hôtes attribués au moment de la réservation. |
|
95 |
|
|
96 |
Il n'est pas possible de réserver des ressources en avance avec OpenStack. |
|
97 |
À notre connaissance, seul OpenNebula propose ce type de service, s'il est couplé avec Haizea. |
|
98 |
Haizea est un système de reservation et d'ordonnancement qui supporte différents types de réservations (immédiates, futures et best effort). Il prend en compte les ressources et le temps nécessaire pour préparer la réservation (transfert des images), et celles occupées par les VMs. Ainsi, les réservations peuvent commencer précisément à l'heure requise, et l'utilisateur obtient exactement la quantité de mémoire disponible qu'il a demandé. |
|
99 |
Il peut être couplé à OpenNebula, ou fonctionner en mode simulation. |
|
100 |
Haizea est écrit en Python et est sous licence Apache 2, comme OpenStack. Haizea a été créé en décembre 2009. |
|
101 |
|
|
102 |
OpenStack n'offre pas un mécanisme simple et élégant, permettant à l'utilisateur de découvrir les propriétés des hôtes disponibles, pour ensuite constuire un filtre pour l'ordonnanceur. Certes, il est possible de lister les hôtes pour obtenir des détails (notamment les CPU infos), mais il serait souhaitable que toutes ces informations soient stockées dans une Configuration Management DataBase (CBDM), dans laquelle l'administrateur pourrait ajouter des informations (par exemple la latence entre chaque noeud), et choisir si elles peuvent êtres exposées à l'utilisateur. Ce dernier pourrait ensuite lister le propriétés disponibles (en parcourant la hiérarchie), et voir les valeurs disponibles pour chacune d'entre elles. Par exemple, sous le noeud "cpu" se trouverait "cpu.frequency", qui contiendrait les valeurs "1Ghz, 2Ghz et 3Ghz". |
|
136 | 103 |
|
137 | 104 |
\section{Système de réservation} |
138 | 105 |
Pour créer des réservations, l'utilisateur doit pouvoir exprimer ses besoins. Ensuite, un algorithme d'ordonnancement trouve les différentes possibilités en fonction de ces besoins et d'autres critères. |
139 | 106 |
|
140 | 107 |
\subsection{Expression des besoins} |
141 |
% TODO limitation : estimation de la durée, en fonction des hôtes choisis. |
|
142 |
% TODO limitation : extension de la durée de réservation et collision avec d'autres réservations... Ou alors accepter l'extension uniquement si ça ne collisionne pas. |
|
108 |
\subsubsection{Choix dans une liste} cette méthode est surtout utilisée par les systèmes qui supportent uniquement la réservation d'instances en faisant abstraction du matériel. Ceux-ci n'ont pas besoin de donner à l'utilisateur la possibilité de choisir les caractéristiques de son hôte physique, car cela n'a pas d'importance. L'utilisateur choisit parmi une liste de flavor (CPU, mémoire, disque), et l'ordonnanceur trouve ensuite un hôte capable de supporter cette flavor (OpenStack). |
|
143 | 109 |
|
144 |
L'utilisateur peut vouloir démarrer sa réservation immédiatement, car il possède déjà les données qu'il veut traiter. Il peut aussi anticiper une tâche, et réserver à l'avance pour être sûr d'avoir bien les ressources au moment voulu. Mais s'il est facile de donner une date de début, estimer la durée d'une tâche l'est beaucoup moins. Comme il est très difficile de calculer précisément la durée d'une tâche, le système de réservation devrait permettre de palier à cet inconvénient en permettant à l'utilisateur d'étendre après coup sa période de réservation, s'il s'aperçoit que sa tâche n'est pas finie lorsque sa réservation va arriver à échéance. |
|
110 |
Cette méthode est aussi utilisée par les fournisseurs qui proposent un choix restreint d'hôtes physiques différents (OVH). |
|
111 |
|
|
112 |
\subsubsection{Construction d'une expression des prérequis} cette méthode est surtout utilisée par les systèmes ouverts (Grid'5000), et dans lesquels les utilisateurs veulent choisir précisément leurs machines. Cependant, OpenStack supporte cette fonctionnalité grâce à des filtres, qui permettent de filtrer sur des propriétés matérielles plus précises, telles que les CPU infos. |
|
145 | 113 |
|
146 |
% TODO donner un exemple d'expression |
|
147 | 114 |
L'utilisateur a parfois une idée très précise des caractéristiques matérielles des hôtes qu'il souhaite réserver, et d'autres fois beaucoup moins. |
148 |
Pour établir la liste des caractéristiques souhaitées, il doit pouvoir choisir parmi un catalogue de propriétés (modèle de CPU, taille du cache mais aussi capacité réseau, etc), et composer une expression, dont la grammaire s'inspire de celle du Json\_filter de Nova. Avec ce filtre, il est possible d'exprimer ses besoins avec plus ou moins de granularité, et il dispose d'opérateurs logiques. Cependant, dans un contexte HPC, les applications sont sensibles aux disparité de performances entre les noeuds, et il sera nécessaire d'adapter ce Json\_filter. En effet, celui-ci retourne actuellement un unique sous-ensemble à partir d'un ensemble d'hôtes. Or, il serait intéressant de pouvoir obtenir plusieurs sous-ensembles à partir d'un ensemble d'hôtes, chaque sous-ensemble étant homogène sur les propriétés spécifiées. Pour réaliser cette adaptation, nous proposons d'introduire le mot clé "homogeneous". |
|
149 |
Ce mot clé pourra être utilisé, par exemple, si le modèle de CPU spécifique n'importe pas, mais que seul le fait que tous les noeuds aient le même CPU est important. L'homogénéité porte en effet surtout sur le CPU, le GPU, et le réseau. En effet, concernant l'espace de stockage, il suffit qu'il soit suffisant. Si un hôte en possède plus, il n'ira généralement pas plus vite. |
|
150 |
Ce mot clé donnera au scheduler plus de liberté dans le choix des hôtes. Cependant, il rajoute encore de la difficulté à estimer la durée totale de sa tâche, car les sous-groupes d'hôtes sélectionnées sont homogènes en performances au sein de chaque groupe, mais hétérogènes en performances entre groupes différents. |
|
115 |
Pour établir la liste des caractéristiques souhaitées, il doit pouvoir choisir parmi un catalogue de propriétés (modèle de CPU, taille du cache mais aussi capacité réseau, etc), et composer une expression en utilisant des opérateurs logique. Cependant, dans un contexte HPC, les applications sont sensibles aux disparité de performances entre les noeuds. Il serait nécessaire de pouvoir exprimer ce besoin, sans pour autant donner obligatoirement une valeur. |
|
116 |
Par exemple, un utilisateur peut vouloir n'importe quel fréquence de processeur, pourvu qu'elles soient toutes les mêmes. |
|
151 | 117 |
|
152 |
Pour optimiser le placement des réservations, nous demandons à l'utilisateur de préciser des bornes temporelles entre lesquelles placer sa réservation. Il donne donc les paramètres suivants : date du début au plus tôt, date de fin au plus tard, durée de la réservation (à placer entre les deux bornes extrêmes), et les propriétés des hôtes. Les réservations immédiates sont supportées (il s'agit juste d'un cas particulier).
|
|
118 |
Ce besoin d'homogénéité s'applique généralement aux CPUs et GPUs, et carte réseau, car ces propriétés dégradent la performances des applications distribuées si elles ne sont pas homogènes. Une quantité de mémoire homogène peut également être importante, dans la mesure où cela facilite le travail du développeur, qui optimise son application pour une taille de mémoire donnée. Mais si un noeud a plus de mémoire qu'un autre, l'application n'ira pas plus vite, ce sera juste de la mémoire inutilisée et "gaspillée".
|
|
153 | 119 |
|
154 |
L'utilisateur fournit le nombre d'hôtes nécessaire. Cependant, on pourrait imaginer que le nombre d'hôtes nécessaires puisse varier au cours d'une réservation. L'idéal serait que l'utilisateur puisse faire une réservation en précisant, par tranche horaire, le nombre de noeuds qu'il souhaite voir allumé. Cependant, cela est très difficilement faisable en pratique, car il est difficile de déterminer à l'avance le temps que va prendre chaque étape dans le calcul. Une alternative serait de donner à l'utilisateur la possibilité, au cours d'une réservation, d'aggréger d'autres hôtes à sa réservation, selon ses besoins. |
|
120 |
\subsection{Types de réservations} |
|
121 |
Le type de réservation dépendra du cas d'usage. |
|
155 | 122 |
|
156 |
Enfin, l'utilisateur peut préciser sur quel critère il veut optimiser le placement de sa réservation. Par exemple, démarrer le plus tôt possible, ou utiliser les machines qui consomment le moins d'énergie, ou choisir le créneau horaire où le coût du courant électrique est le plus bas. Il doit pouvoir consulter ces critères dans un catalogue. Cependant, ces critères peuvent entrer en conflit avec l'optimisation effectuée par le DCIM, donc il ne sont pas forcément autorisés.
|
|
123 |
Les réservations immédiates doivent être honorées immédiatement, ou pas du tout.
|
|
157 | 124 |
|
158 |
Pour récapituler, la figure \ref{reservation_parameters_table} présente les paramètres passés par l'utilisateur au système pour créer une réservation.
|
|
125 |
Les réservations en avance doivent commencer et terminer à des heures spécifiques.
|
|
159 | 126 |
|
160 |
\begin{table} |
|
161 |
\renewcommand{\arraystretch}{1.3} |
|
162 |
\caption{Arguments used for creating a reservation} |
|
163 |
\label{reservation_parameters_table} |
|
164 |
\centering |
|
165 |
\begin{tabular}{|l|l|} |
|
166 |
\hline |
|
167 |
\bfseries Argument & \bfseries Description\\ |
|
168 |
\hline |
|
169 |
start\_time & Not sooner than timestamp \\ |
|
170 |
end\_time & Not later than timestamp \\ |
|
171 |
duration & Reservation duration \\ |
|
172 |
quantity & Hosts quantity \\ |
|
173 |
host\_properties & Hosts selection criteria \\ |
|
174 |
scheduler & Scheduler algorithm \\ |
|
175 |
\hline |
|
176 |
\end{tabular} |
|
177 |
\end{table} |
|
127 |
Les réservations best effort sont placées dans une file, et honorées dès que possible. On peut imaginer des options : deadline, tarif degressif. |
|
128 |
Elle peuvent être non-préemptables ou préemptables. Dans ce cas, elles peuvent être interrompues s'il y a des réservations plus urgentes (immédiates ou en avance). Une réservation interrompue est soit migrée vers un autre hôte (à chaud ou à froid), soit suspendue puis relancée sur le même hôte, soit tuée (c'est alors à l'application de checkpointer). |
|
129 |
|
|
130 |
Le système supporte aussi les instances non-réservées (comme cela existe dans Nova actuellement). |
|
131 |
|
|
132 |
\subsection{Ajout dynamique de ressources à la réservation} |
|
133 |
Au moment de la réservation, l'utilisateur précise le nombre la quantité de resources nécessaire. |
|
134 |
Mais au cours de la réservation, ses besoins peuvent évoluer. Il doit pouvoir ajouter des ressources ou en supprimer, à la volée. |
|
135 |
Le prix horaire de ces ressources supplémentaire sera plus élevé que les ressources réservées en avance (pour inciter l'utilisateur à estimer au plus juste la quantité de ressources nécessaires). |
|
178 | 136 |
|
179 |
\subsection{Modèles de réservation}
|
|
137 |
\subsection{Affectation des hôtes physiques à la réservation}
|
|
180 | 138 |
Il y a deux manières d'enregistrer une réservation : soit c'est au moment de la réservation qu'est choisi un sous-ensemble parmi les hôtes candidats, soit on ne choisit pas les resources au moment de la réservation, mais on garantie seulement que lorsque la réservation deviendra active, on aura suffisament de ressources disponibles. Dans ce dernier cas, il faut considérer chaque réservation comme une règle, et chaque demande d'instanciation ou de réservation, par la suite, comme d'autres règles qui ne peuvent être acceptées que si elles sont compatibles avec toutes les règles précédentes inscrites dans le système. |
181 | 139 |
|
182 | 140 |
% TODO pro / cons |
... | ... | |
187 | 145 |
|
188 | 146 |
Il convient aussi de gérer correctement le cas où des instances non-réservées sont instanciées sur un hôte qui a une réservation prévue dans le futur. On peut permettre à de telles instances d'être créées, mais donner la priorité aux réservations : si une réservation doit commencer, les instances non réservées sont soit tuées brutalement, soit mises en pause (moyennant un petit délai), soit migrées sur d'autres hôtes disponibles. |
189 | 147 |
|
148 |
\subsection{Annulation de réservation} |
|
149 |
Les réservations peuvent être annulées, avant leur fin, afin de ne pas monopoliser des ressources dont l'utilisateur n'a plus besoin, et avant leur commencement, si l'utilisateur change d'avis. |
|
150 |
Cependant, une annulation doit entraîner une pénalité pour l'utilisateur, car celui-ci pourrait faire des réservations multiples suivies d'annulations pour tenter de deviner la taille et les caractéristiques de l'infrastructure du datacenter. Et d'autre part, une annulation avant la fin d'une réservation dénote une mauvaise estimation de la durée de la réservation. |
|
151 |
Avant le début de réservation, plus l'utilisateur l'annule tôt, mieux il sera remboursé. Cependant, si l'utilisateur l'annule immédiatement après avoir réservé, le taux de remboursement est moins de 100\% pour éviter qu'il ne fasse des reservations multiples. |
|
152 |
Une fois la réservation démarrée, si l'utilisateur l'annule, il est remboursé sur la base de la période qui n'a pas été consommée. Le taux de remboursement est fixe (par exemple 75\%). L'utilisateur pourrait récupérer son argent, mais il semble plus judicieux de lui rembourser sous forme de crédits qu'il pourra utiliser lors d'une prochaine réservation. |
|
153 |
|
|
154 |
\subsection{Facturation des réservations} |
|
155 |
Les réservations, en garantissant un environnement single-tenant, permettent une facturation à l'usage précise et incontestable. |
|
156 |
En effet, sur les environnements multi-tenant, il est difficile de répartir le coût statique des machines : les clients seuls sur une machine seraient défavorisés par rapport à ceux qui se partagent un même machine. En effet, le coût statique d'une machine étant invariable, plus il y a d'utilisateurs par machine, plus la part de coût statique par utilisateur est bas. |
|
157 |
|
|
158 |
La facturation prend en compte une part statique, qui est facturée au moment de la réservation, et une part dynamique calculée une fois la réservation terminée, et qui varie selon l'énergie consommée (kWh consommés multipliés par le coût du kWh). Cela incite les clients à optimiser leurs programmes, et permet une facturation équitable des clients. |
|
159 |
|
|
160 |
\subsubsection{Part statique} |
|
161 |
\paragraph{Type de réservation} les réservations immédiates sont les plus chères, et les best efforts les moins chères. Les réservations en avance pourront avoir un tarif dégressif, par tranche de temps : par exemple la première semaine coûtera un peu plus cher que la seconde semaine, et ainsi de suite. |
|
162 |
|
|
163 |
\paragraph{Performance des machines} les machines les plus performantes doivent coûter plus cher, car elles sont plus récentes, plus onéreuses, terminent plus rapidement les tâches soumises et sont très souvent utilisées pour des applications urgentes. Ainsi, pour un même ratio Flops/W, la machine la plus rapide devra coûter plus cher. |
|
164 |
|
|
165 |
\subsubsection{Part dynamique} |
|
166 |
\paragraph{Utilisation des ressources} grâce à un service de réservation, le DCIM peut faire des prévisions d'usage du datacenter, et ainsi proposer des tarifs plus avantageux durant les heures creuses. Au contraire, durant les pics de charge, le tarif pourra être plus élevé. Cela permet de tenir compte du coût de l'énergie qui peut être variable, afin d'en répercuter le coût sur les utilisateurs. De plus, lisser la charge et éviter les pics peut permettre un meilleur taux d'usage global du datacenter, et faciliter son implantation dans des zones où la puissance maximum qu'il est possible de tirer est plafonnée. |
|
167 |
|
|
168 |
Cependant, proposer des tarifs variable en fonction du temps dévoile quelle est l'activité du datacenter. Selon le degré de transparence du fournisseur, celui pourra choisir de proposer une variation de tarif à plus ou moins fine granularité, afin de préserver un certain niveau de confidentialité. Par exemple, des tarifs variants heure par heure dévoilent beaucoup de choses sur l'activité du datacenter, tandis que s'ils varient par chaque mois, cela masque de l'information. Cependant, même avec une variable à grosse granularité, il sera possible de dégager des courbes de tendances, qui peuvent être porteuse de beaucoup d'informations. De plus, une grosse granularité aura tendance à favoriser les clients plus aggressifs et pénaliser ceux dont les réservations sont placées au endroits les meilleurs. Faut-il mieux risquer de perdre certains clients aggressifs, ou perdre des clients souples ? |
|
169 |
|
|
190 | 170 |
\subsection{Algorithme de réservation} |
191 | 171 |
Le rôle d'un tel algorithme est de trouver quels sont les emplacements libres pour placer une réservation. |
192 | 172 |
Il prend en entrée les paramètres présentés dans la figure \ref{reservation_parameters_table} et retourne en sortie des propositions de placement de réservation. |
193 | 173 |
|
194 |
L'algorithme le plus basique se contente de trouver la première période libre, pendant la durée requise. Pour cela, il trie la liste des hôtes candidats par date de disponibilité au plus tôt. Ensuite, il prend le premier hôte de cette liste, et essai d'aggréger autant d'hôtes que nécessaire sur cette période de temps. S'il n'y en a pas assez, il trouve le second hôte disponible au plus tôt, et recommence le processus. |
|
174 |
\subsubsection{Algorithme first-fit} |
|
175 |
L'algorithme first-fit est basique et rapide. Il se contente de trouver la première période libre, pendant la durée requise. Pour cela, il trie la liste des hôtes candidats par date de disponibilité au plus tôt. Ensuite, il prend le premier hôte de cette liste, et essai d'aggréger autant d'hôtes que nécessaire sur cette période de temps. S'il n'y en a pas assez, il trouve le second hôte disponible au plus tôt, et recommence le processus. |
|
195 | 176 |
|
177 |
\subsubsection{Algorithmes avancés} |
|
196 | 178 |
Des algorithmes bien plus évolués peuvent être mis en place, pour optimiser les réservations en fonction du le coût du courant, ou pour lisser la charge, ou encore limiter les cycles d'extinction/rallumage des machines. |
197 | 179 |
|
180 |
\subsubsection{Solutions multiples et suggestions} |
|
198 | 181 |
Lorsque plusieurs choix sont possibles, le scheduler à deux possibilités : soit il n'en retourne qu'un, ne donnant aucun choix à l'utilisateur, soit il retourne la liste des propositions et l'utilisateur choisit celle qu'il veut. La première approche nécessite que l'utilisateur décrive en amont les critères de son choix (afin que le scheduler sache laquelle choisir). La deuxième solution peut présenter plus d'intérêt pour le DCIM, qui choisit, selon ses propres critères, le meilleur choix de son point de vue. |
199 | 182 |
De plus, faire choisir l'utilisateur entre plusieurs possibilités peut conduire à dévoiler un peu l'usage du datacenter. |
200 | 183 |
|
... | ... | |
204 | 187 |
Cependant, un utilisateur qui voudrait le deviner pourrait faire un grand nombre de requêtes, avec des critères trop sélectifs, et en restreignant petit à petit ses critères, trouver les limites du datacenter. |
205 | 188 |
Il faut donc se prémunir de ce type d'attaque. Une tentative de réservation qui échoue ne peut pas être facturée, donc on ne peut pas jouer sur ce levier. En revanche, on peut fixer des limites aux valeurs extrêmes des paramètres, et limiter le nombre de requêtes par seconde. |
206 | 189 |
|
207 |
\subsection{Annulation de réservation} |
|
208 |
Les réservations peuvent être annulées, avant leur fin, afin de ne pas monopoliser des ressources dont l'utilisateur n'a plus besoin, et avant leur commencement, si l'utilisateur change d'avis. |
|
209 |
Cependant, une annulation doit entraîner une pénalité pour l'utilisateur, car celui-ci pourrait faire des réservations multiples suivies d'annulations pour tenter de deviner la taille et les caractéristiques de l'infrastructure du datacenter. Et d'autre part, une annulation avant la fin d'une réservation dénote une mauvaise estimation de la durée de la réservation. |
|
210 |
Avant le début de réservation, plus l'utilisateur l'annule tôt, mieux il sera remboursé. Cependant, si l'utilisateur l'annule immédiatement après avoir réservé, le taux de remboursement est moins de 100\% pour éviter qu'il ne fasse des reservations multiples. |
|
211 |
Une fois la réservation démarrée, si l'utilisateur l'annule, il est remboursé sur la base de la période qui n'a pas été consommée. Le taux de remboursement est fixe (par exemple 75\%). L'utilisateur pourrait récupérer son argent, mais il semble plus judicieux de lui rembourser sous forme de crédits qu'il pourra utiliser lors d'une prochaine réservation. |
|
190 |
\section{Architecture d'efficience énergétique} |
|
191 |
L'architecture d'efficience énergétique met à disposition du scheduler les informations nécessaires pour prendre ses décisions de placement. |
|
212 | 192 |
|
213 |
\subsection{Facturation} |
|
214 |
Grâce au service de réservation, un client est seul sur l'hôte réservé, ce qui permet une facturation à l'usage précise et incontestable. |
|
215 |
En effet, sur des environnements sans réservation, il est difficile de répartir les coûts entre plusieurs utilisateurs, s'ils se partagent les mêmes machines. Il existe bien des modèles pour estimer la consommation par machine virtuelle, mais il est difficile de prouver à un utilisateur sa consommation, et se pose aussi le problème de la répartition du coût statique de l'hôte: en effet, un serveur qui ne fait rien consomme quand même, donc plus il y a d'utilisateurs qui se partagent cette machine, moins ce coût est élevé par utilisateur. Une facturation à l'usage incite les clients à optimiser leurs programmes, et permet une facturation équitable des clients. |
|
193 |
\subsection{Kwapi} |
|
194 |
Kwapi is our framework, designed for acquiring energy consumption metrics. It allows, among other, to upload metrics from the wattmeters to Ceilometer. |
|
216 | 195 |
|
217 |
La facturation prend en compte une part statique, qui est facturée au moment de la réservation, et une part dynamique calculée une fois la réservation terminée, et qui varie selon l'énergie consommée (kWh consommés multipliés par le coût du kWh). |
|
196 |
Its architecture is based on a layer of drivers, responsible for the acquisition metrics, and a layer of plugins that collect these metrics. The communication between these two layers goes through a bus. |
|
197 |
|
|
198 |
Drivers and plugins are easily extensible to support other types of wattmeters, and provide other services. |
|
199 |
|
|
200 |
\subsubsection{Drivers layer} |
|
201 |
The drivers are threads started by a manager, which instantiate them with a set of parameters loaded from a configuration file (unified with the OpenStack configuration file format, similar to INI). These parameters are used to query the meters (IP address, port, etc.) and indicate the sensor IDs in the issued metrics. The metrics are Python dictionary with a set of fields. Optional fields can be added, such as voltage, amperage, etc.. The metrics are signed. |
|
202 |
|
|
203 |
The manager periodically checks if all threads are active, and restart them if necessary (incidents may occur, for example if a meter is disconnected or becomes inaccessible). The drivers can manage incidents themselves, but if they finish their execution, it does not matter because they will be automatically restarted by the manager. It is important to avoid losing measurements because the information reported is watts and not kWh: if a value in watts is lost, we lose information. |
|
204 |
|
|
205 |
\subsubsection{Plugins layer} |
|
206 |
The plugins retrieve and process the metrics sent by the drivers on the bus. They expose them to other services (Ceilometer) or user (visualization). They can subscribe to all sensors, or just some of them, through a system of prefixes. After checking the message signature, they extract the fields, and process the received data. Kwapi has a plugin API for Ceilometer, which computes the number of kWh of each probe, appends a timestamp, and stores the last value in watts. These data are not stored in a database, as Ceilometer already has one. If a probe has not issued metrics for a long time, the corresponding data are removed. This plugin has a REST API that allows to retrieve the probe names, and W, kWh or timestamp. |
|
207 |
|
|
208 |
\subsection{Kwranking} |
|
209 |
Pour améliorer l'efficacité énergétique, il faut que les machines les plus efficientes soient utilisées en priorité (en particulier pour les tâches qui demandent beaucoup de puissance). |
|
210 |
|
|
211 |
L'efficacité énergétique se définit en flops/w, donc il faut pondérer les valeurs de consommation récupérées depuis les wattmètres par un indice de performance. |
|
212 |
Cet indice peut être obtenu à l'aide d'un benchmark, mais cela oblige à exécuter ce benchmark sur les machines après leur installation dans le datacenter. L'autre solution, plus simple à mettre en place, est d'estimer la performance à partir des propriétés CPU (ou GPU) de l'hôte. Cela fait sens dans la mesure où le CPU et le GPU comptent parmi les composants les plus énergivores et dont la puissance demandée est fonction de la charge soumise. |
|
213 |
|
|
214 |
Pour élaborer cet indice, on prend en compte la famille du processeur, le nombre de puces, de coeurs et de threads, ainsi que la mémoire cache et la fréquence. |
|
215 |
La famille du processeur compte beaucoup, car elle conditionne le jeu d'instruction disponible. C'est d'ailleurs pour cette raison qu'une mesure en Bogomips n'a pas de sens, car cet indice tient compte uniquement du nombre de fois où le processeur est capable de ne rien faire par seconde. Cela ne prend pas en compte le jeu d'instruction plus ou moins optimisé. |
|
216 |
|
|
217 |
% TODO flop/w, pour le min, l'avg ou le max ? |
|
218 |
Dans le cadre de notre infrastructure énergétique, nous mémorisons, pour chaque hôte, sa consommation min, avg, et max, et l'indice en flop/w. |
|
219 |
Kwranking est capable d'enrichir une liste hôte avec leurs propriétés énergétique (sans faire de tri toutefois). |
|
220 |
Cette fonctionnalité est utilisée lors du choix des hôtes, à deux reprises. |
|
221 |
La première fois au moment de la réservation : par exemple, si l'utilisateur veut des processeurs homogènes, plusieurs familles de processeurs seront candidates, et celles-ci seront pondérées par Kwranking. La seconde fois, au moment de l'instanciation de VMs : d'une part, certaines machines peuvent être plus chaudes que d'autres, et la vitesse des ventilateurs impactent sur la consommation, et d'autre part, des hôtes strictement identiques d'un point de vue matériel peuvent présenter des différences de consommation allant jusqu'à 20\% (cela est du aux aléas de la fabrication des puces). Il s'agit donc de choisir, au moment d'une instantiation de VM, quel est l'hôte le moins consommateur parmis les hôtes réservés. |
|
222 |
|
|
223 |
De même, parmi les hôtes réservés, on aura tendance à mettre en veille ceux qui consomment le plus. |
|
224 |
|
|
225 |
L'utilisation de ce module consiste à lui passer une liste d'hôtes en paramètre, qu'il retourne enrichie, pour chaque hôte, de son indice de performances, et de sa consommation minimum, moyenne et maximum. |
|
226 |
|
|
227 |
\subsection{Kwassign} |
|
228 |
La facturation devrait tenir compte de l'usage qui est fait des ressources. Cela permet d'inciter les clients à mieux optimiser leur programmes et permet à ceux dont les programmes sont légers d'avoir des tarifs plus abordables. |
|
229 |
Ce modèle de facturation nécessite deux choses : la première est d'avoir des équipements de mesures de la consommation énergétique, et la seconde de pouvoir assigner ces "mesures" à un utilisateur particulier. Les environnements mono-tenancy se prêtent bien à cette opération, car il n'y a pas besoin de recourir à des estimations de la consommation des VMs, qui pourraient être remises en question. |
|
230 |
Kwapi, le framework de remontée énergétique, ne connait pas quel utilisateur était assigné à telle machine à un moment donné. |
|
231 |
Ces valeurs sont stockées dans Ceilometer collector, et il serait souhaitable de les assigner aux clients avant leur stockage, afin qu'ils puissent librement interroger l'API de Ceilometer et retrouver leur consommation énergétique. De plus, cette assignation n'a besoin de se faire qu'une seule fois. |
|
232 |
Nous avons donc créé un module logiciel qui se branche sur le bus de Ceilometer, et modifie à la volée les métriques remontée, en leur assignant un propriétaire. Pour cela, il interroge le calendrier de réservation de Climate. |
|
233 |
En revanche se trouve dans Climate le calendrier de réservation. |
|
234 |
Dans le cas de réservations non réservés, et donc en environnement potentiellement multi-tenancy, on ne réalise aucune assignation, et on ne rend pas non plus accessible la consommation des machines concernées, car cela dévoilerait l'activité des autres utilisateurs. |
|
235 |
|
|
236 |
\subsection{Modes de veille} |
|
237 |
Climate Power permet de gérer les modes de veille des machines. Comme Climate dispose d'un calendrier de réservation dans le temps, il est facile de s'en servir pour savoir quand mettre en veille et allumer les machines. Pour prendre une décision, il faut tenir compte des prochaines réservation qui vont devenir active, et de la probabilité qu'une instance non réservée soit ordonnancée sur une machine donnée. Lorsque qu'une réservation devient active, soit l'utilisateur a immédiatement besoin de toute ses ressources (dans ce cas là ce module devra anticiper les réservations qui vont devenir active et allumer les machines en avance), soit il veut simplement avoir la garantie de disposer d'un certain nombre de machines, mais n'est pas très regardant sur le délai de mise en route. Dans ce dernier cas, laisser ses machines en veille un peu plus longtemps lui fera économiser la consommation idle. Ou pourrait par exemple donner la possibilité à l'utilisateur de préciser le nombre de machine qu'il souhaite utiliser immédiatement. |
|
238 |
|
|
239 |
L'utilisateur doit avoir accès à l'API de Climate Power pour gérer lui même la consommation de ses machines en fonction du temps, s'il n'a pas besoin de la même quantité de machine dans le temps. Nova aussi utilise cette API, pour allumer un hôte lorsqu'une instance non-réservée doit y être lancée. |
|
240 |
|
|
241 |
Climate doit choisir quel mode de veille utiliser. Plus la veille est profonde, plus cela met du temps à rallumer la machine et plus cela est coûteux en terme d'énergie. |
|
242 |
% TODO REF |
|
243 |
On notera qu'il ne semble pas préjudiciable à la durée de vie des machines de les éteindre et rallumer fréquemment (selon REF). |
|
218 | 244 |
|
219 |
La part statique est basée sur les paramètres suivants : |
|
220 | 245 |
|
221 |
\paragraph{Performance des machines} les machines les plus performantes doivent coûter plus cher, car elles sont plus récentes, plus onéreuses, et sont très souvent utilisées par les applications qui requièrent des réservations urgentes. Ainsi, pour un même ratio Flops/W, la machine la plus rapide devra coûter plus cher. |
|
222 | 246 |
|
223 |
\paragraph{Charge} grâce à un service de réservation, le DCIM peut faire des prévisions d'usage du datacenter, et ainsi proposer des tarifs plus avantageux durant les heures creuses. Au contraire, durant les pics de charge, le tarif pourra être plus élevé. Cela permet de tenir compte du coût de l'énergie qui peut être variable, afin d'en répercuter le coût sur les utilisateurs. De plus, lisser la charge et éviter les pics peut permettre un meilleur taux d'usage global du datacenter, et faciliter son implantation dans des zones où la puissance maximum qu'il est possible de tirer est plafonnée. |
|
224 | 247 |
|
225 |
Cependant, proposer des tarifs variable en fonction du temps dévoile quelle est l'activité du datacenter. Selon le degré de transparence du fournisseur, celui pourra choisir de proposer une variation de tarif à plus ou moins fine granularité, afin de préserver un certain niveau de confidentialité. Par exemple, des tarifs variants heure par heure dévoilent beaucoup de choses sur l'activité du datacenter, tandis que s'ils varient par chaque mois, cela masque de l'information. Cependant, même avec une variable à grosse granularité, il sera possible de dégager des courbes de tendances, qui peuvent être porteuse de beaucoup d'informations. De plus, une grosse granularité aura tendance à favoriser les clients plus aggressifs et pénaliser ceux dont les réservations sont placées au endroits les meilleurs. Faut-il mieux risquer de perdre certains clients aggressifs, ou perdre des clients souples ? |
|
248 |
|
|
249 |
|
|
250 |
|
|
251 |
|
|
252 |
|
|
253 |
|
|
254 |
|
|
255 |
|
|
256 |
|
|
257 |
|
|
258 |
|
|
259 |
|
|
260 |
|
|
261 |
|
|
262 |
|
|
263 |
|
|
264 |
|
|
265 |
|
|
266 |
|
|
267 |
|
|
268 |
% TODO limitation : estimation de la durée, en fonction des hôtes choisis. |
|
269 |
% TODO limitation : extension de la durée de réservation et collision avec d'autres réservations... Ou alors accepter l'extension uniquement si ça ne collisionne pas. |
|
270 |
|
|
271 |
L'utilisateur peut vouloir démarrer sa réservation immédiatement, car il possède déjà les données qu'il veut traiter. Il peut aussi anticiper une tâche, et réserver à l'avance pour être sûr d'avoir bien les ressources au moment voulu. Mais s'il est facile de donner une date de début, estimer la durée d'une tâche l'est beaucoup moins. Comme il est très difficile de calculer précisément la durée d'une tâche, le système de réservation devrait permettre de palier à cet inconvénient en permettant à l'utilisateur d'étendre après coup sa période de réservation, s'il s'aperçoit que sa tâche n'est pas finie lorsque sa réservation va arriver à échéance. |
|
272 |
|
|
273 |
% TODO donner un exemple d'expression |
|
274 |
|
|
275 |
|
|
276 |
Pour optimiser le placement des réservations, nous demandons à l'utilisateur de préciser des bornes temporelles entre lesquelles placer sa réservation. Il donne donc les paramètres suivants : date du début au plus tôt, date de fin au plus tard, durée de la réservation (à placer entre les deux bornes extrêmes), et les propriétés des hôtes. Les réservations immédiates sont supportées (il s'agit juste d'un cas particulier). |
|
277 |
|
|
278 |
L'utilisateur fournit le nombre d'hôtes nécessaire. Cependant, on pourrait imaginer que le nombre d'hôtes nécessaires puisse varier au cours d'une réservation. L'idéal serait que l'utilisateur puisse faire une réservation en précisant, par tranche horaire, le nombre de noeuds qu'il souhaite voir allumé. Cependant, cela est très difficilement faisable en pratique, car il est difficile de déterminer à l'avance le temps que va prendre chaque étape dans le calcul. Une alternative serait de donner à l'utilisateur la possibilité, au cours d'une réservation, d'aggréger d'autres hôtes à sa réservation, selon ses besoins. |
|
279 |
|
|
280 |
Enfin, l'utilisateur peut préciser sur quel critère il veut optimiser le placement de sa réservation. Par exemple, démarrer le plus tôt possible, ou utiliser les machines qui consomment le moins d'énergie, ou choisir le créneau horaire où le coût du courant électrique est le plus bas. Il doit pouvoir consulter ces critères dans un catalogue. Cependant, ces critères peuvent entrer en conflit avec l'optimisation effectuée par le DCIM, donc il ne sont pas forcément autorisés. |
|
281 |
|
|
282 |
Pour récapituler, la figure \ref{reservation_parameters_table} présente les paramètres passés par l'utilisateur au système pour créer une réservation. |
|
283 |
|
|
284 |
\begin{table} |
|
285 |
\renewcommand{\arraystretch}{1.3} |
|
286 |
\caption{Arguments used for creating a reservation} |
|
287 |
\label{reservation_parameters_table} |
|
288 |
\centering |
|
289 |
\begin{tabular}{|l|l|} |
|
290 |
\hline |
|
291 |
\bfseries Argument & \bfseries Description\\ |
|
292 |
\hline |
|
293 |
start\_time & Not sooner than timestamp \\ |
|
294 |
end\_time & Not later than timestamp \\ |
|
295 |
duration & Reservation duration \\ |
|
296 |
quantity & Hosts quantity \\ |
|
297 |
host\_properties & Hosts selection criteria \\ |
|
298 |
scheduler & Scheduler algorithm \\ |
|
299 |
\hline |
|
300 |
\end{tabular} |
|
301 |
\end{table} |
|
302 |
|
|
226 | 303 |
|
227 | 304 |
% TODO Scénarios et validation. |
228 | 305 |
|
... | ... | |
314 | 391 |
\bfseries Method & \bfseries URL & \bfseries Description\\ |
315 | 392 |
\hline |
316 | 393 |
GET & /properties/ & Lists the properties\\ |
317 |
POST & /reservations/ & Creates a réservation\\
|
|
318 |
GET & /reservations/ & Lists the réservations\\
|
|
319 |
GET & /reservations/<réservation-id> & Describes a réservation\\
|
|
320 |
DELETE & /reservations/<réservation-id> & Cancels a réservation\\
|
|
394 |
POST & /reservations/ & Creates a reservation\\
|
|
395 |
GET & /reservations/ & Lists the reservations\\
|
|
396 |
GET & /reservations/<réservation-id> & Describes a reservation\\
|
|
397 |
DELETE & /reservations/<réservation-id> & Cancels a reservation\\
|
|
321 | 398 |
\hline |
322 | 399 |
\end{tabular} |
323 | 400 |
\end{table} |
... | ... | |
328 | 405 |
|
329 | 406 |
L'inventaire prend en paramètre les host\_properties. Mais l'utilisateur doit être capable d'élaborer un tel filtre. Pour cela, il utilise la méthode de l'API /properties/, qui fournit un catalogue des propriétés que l'on peut trier. Cette méthode liste les propriétés présentes dans les détails de hôte enregistrés dans la base Nova, mais le DCIM peut en masquer certaines, et en ajouter d'autres. |
330 | 407 |
|
331 |
\subsubsection{Power} |
|
332 |
Climate Power permet de gérer les modes de veille des machines. Comme Climate dispose d'un calendrier de réservation dans le temps, il est facile de s'en servir pour savoir quand mettre en veille et allumer les machines. Pour prendre une décision, il faut tenir compte des prochaines réservation qui vont devenir active, et de la probabilité qu'une instance non réservée soit ordonnancée sur une machine donnée. Lorsque qu'une réservation devient active, soit l'utilisateur a immédiatement besoin de toute ses ressources (dans ce cas là ce module devra anticiper les réservations qui vont devenir active et allumer les machines en avance), soit il veut simplement avoir la garantie de disposer d'un certain nombre de machines, mais n'est pas très regardant sur le délai de mise en route. Dans ce dernier cas, laisser ses machines en veille un peu plus longtemps lui fera économiser la consommation idle. Ou pourrait par exemple donner la possibilité à l'utilisateur de préciser le nombre de machine qu'il souhaite utiliser immédiatement. |
|
333 |
|
|
334 |
L'utilisateur doit avoir accès à l'API de Climate Power pour gérer lui même la consommation de ses machines en fonction du temps, s'il n'a pas besoin de la même quantité de machine dans le temps. Nova aussi utilise cette API, pour allumer un hôte lorsqu'une instance non-réservée doit y être lancée. |
|
335 |
|
|
336 |
Climate doit choisir quel mode de veille utiliser. Plus la veille est profonde, plus cela met du temps à rallumer la machine et plus cela est coûteux en terme d'énergie. |
|
337 |
% TODO REF |
|
338 |
On notera qu'il ne semble pas préjudiciable à la durée de vie des machines de les éteindre et rallumer fréquemment (selon REF). |
|
339 |
|
|
340 | 408 |
\subsection{Nova} |
341 | 409 |
Nova est le module de lancement d'instances d'OpenStack. Par défaut, lorsqu'un instance doit être chargée, les hôtes passent dans des filtres qui ne laissent passer que les hôtes éligibles. Ensuite, les hôtes restants sont pondérés, et ceux de poids les plus faibles sont élus. Le scheduler permet de passer des scheduler\_hint. |
342 | 410 |
|
... | ... | |
358 | 426 |
|
359 | 427 |
Il faudra veiller à la pondération, afin que le premier filtre ait une "haute priorité". |
360 | 428 |
|
361 |
\subsection{Kwapi} |
|
362 |
Kwapi is our framework, designed for acquiring energy consumption metrics. It allows, among other, to upload metrics from the wattmeters to Ceilometer. |
|
363 |
|
|
364 |
Its architecture is based on a layer of drivers, responsible for the acquisition metrics, and a layer of plugins that collect these metrics. The communication between these two layers goes through a bus. |
|
365 |
|
|
366 |
Drivers and plugins are easily extensible to support other types of wattmeters, and provide other services. |
|
367 |
|
|
368 |
\subsubsection{Drivers layer} |
|
369 |
The drivers are threads started by a manager, which instantiate them with a set of parameters loaded from a configuration file (unified with the OpenStack configuration file format, similar to INI). These parameters are used to query the meters (IP address, port, etc.) and indicate the sensor IDs in the issued metrics. The metrics are Python dictionary with a set of fields. Optional fields can be added, such as voltage, amperage, etc.. The metrics are signed. |
|
370 |
|
|
371 |
The manager periodically checks if all threads are active, and restart them if necessary (incidents may occur, for example if a meter is disconnected or becomes inaccessible). The drivers can manage incidents themselves, but if they finish their execution, it does not matter because they will be automatically restarted by the manager. It is important to avoid losing measurements because the information reported is watts and not kWh: if a value in watts is lost, we lose information. |
|
372 |
|
|
373 |
\subsubsection{Plugins layer} |
|
374 |
The plugins retrieve and process the metrics sent by the drivers on the bus. They expose them to other services (Ceilometer) or user (visualization). They can subscribe to all sensors, or just some of them, through a system of prefixes. After checking the message signature, they extract the fields, and process the received data. Kwapi has a plugin API for Ceilometer, which computes the number of kWh of each probe, appends a timestamp, and stores the last value in watts. These data are not stored in a database, as Ceilometer already has one. If a probe has not issued metrics for a long time, the corresponding data are removed. This plugin has a REST API that allows to retrieve the probe names, and W, kWh or timestamp. |
|
375 |
|
|
376 |
\subsection{Kwranking} |
|
377 |
Pour améliorer l'efficacité énergétique, il faut que les machines les plus efficientes soient utilisées en priorité (en particulier pour les tâches qui demandent beaucoup de puissance). |
|
429 |
\section{Limitations} |
|
430 |
Nous pouvons identifier deux types de limitations : celles inhérentes au système de réservation, et celles portant sur des éléments techniques susceptibles d'évoluer. |
|
378 | 431 |
|
379 |
L'efficacité énergétique se définit en flops/w, donc il faut pondérer les valeurs de consommation récupérées depuis les wattmètres par un indice de performance. |
|
380 |
Cet indice peut être obtenu à l'aide d'un benchmark, mais cela oblige à exécuter ce benchmark sur les machines après leur installation dans le datacenter. L'autre solution, plus simple à mettre en place, est d'estimer la performance à partir des propriétés CPU (ou GPU) de l'hôte. Cela fait sens dans la mesure où le CPU et le GPU comptent parmi les composants les plus énergivores et dont la puissance demandée est fonction de la charge soumise. |
|
381 | 432 |
|
382 |
Pour élaborer cet indice, on prend en compte la famille du processeur, le nombre de puces, de coeurs et de threads, ainsi que la mémoire cache et la fréquence. |
|
383 |
La famille du processeur compte beaucoup, car elle conditionne le jeu d'instruction disponible. C'est d'ailleurs pour cette raison qu'une mesure en Bogomips n'a pas de sens, car cet indice tient compte uniquement du nombre de fois où le processeur est capable de ne rien faire par seconde. Cela ne prend pas en compte le jeu d'instruction plus ou moins optimisé. |
|
384 |
|
|
385 |
% TODO flop/w, pour le min, l'avg ou le max ? |
|
386 |
Dans le cadre de notre infrastructure énergétique, nous mémorisons, pour chaque hôte, sa consommation min, avg, et max, et l'indice en flop/w. |
|
387 |
Kwranking est capable d'enrichir une liste hôte avec leurs propriétés énergétique (sans faire de tri toutefois). |
|
388 |
Cette fonctionnalité est utilisée lors du choix des hôtes, à deux reprises. |
|
389 |
La première fois au moment de la réservation : par exemple, si l'utilisateur veut des processeurs homogènes, plusieurs familles de processeurs seront candidates, et celles-ci seront pondérées par Kwranking. La seconde fois, au moment de l'instanciation de VMs : d'une part, certaines machines peuvent être plus chaudes que d'autres, et la vitesse des ventilateurs impactent sur la consommation, et d'autre part, des hôtes strictement identiques d'un point de vue matériel peuvent présenter des différences de consommation allant jusqu'à 20\% (cela est du aux aléas de la fabrication des puces). Il s'agit donc de choisir, au moment d'une instantiation de VM, quel est l'hôte le moins consommateur parmis les hôtes réservés. |
|
390 | 433 |
|
391 |
De même, parmi les hôtes réservés, on aura tendance à mettre en veille ceux qui consomment le plus. |
|
434 |
% TODO difficulté à évaluer la durée d'une tâche |
|
435 |
% En effet, celui-ci retourne actuellement un unique sous-ensemble à partir d'un ensemble d'hôtes. Or, il serait intéressant de pouvoir obtenir plusieurs sous-ensembles à partir d'un ensemble d'hôtes, chaque sous-ensemble étant homogène sur les propriétés spécifiées. Pour réaliser cette adaptation, nous proposons d'introduire le mot clé "homogeneous". |
|
436 |
% Ce mot clé pourra être utilisé, par exemple, si le modèle de CPU spécifique n'importe pas, mais que seul le fait que tous les noeuds aient le même CPU est important. L'homogénéité porte en effet surtout sur le CPU, le GPU, et le réseau. En effet, concernant l'espace de stockage, il suffit qu'il soit suffisant. Si un hôte en possède plus, il n'ira généralement pas plus vite. |
|
437 |
% Ce mot clé donnera au scheduler plus de liberté dans le choix des hôtes. Cependant, il rajoute encore de la difficulté à estimer la durée totale de sa tâche, car les sous-groupes d'hôtes sélectionnées sont homogènes en performances au sein de chaque groupe, mais hétérogènes en performances entre groupes différents. |
|
392 | 438 |
|
393 |
L'utilisation de ce module consiste à lui passer une liste d'hôtes en paramètre, qu'il retourne enrichie, pour chaque hôte, de son indice de performances, et de sa consommation minimum, moyenne et maximum. |
|
394 | 439 |
|
395 |
\subsection{Kwassign} |
|
396 |
La facturation devrait tenir compte de l'usage qui est fait des ressources. Cela permet d'inciter les clients à mieux optimiser leur programmes et permet à ceux dont les programmes sont légers d'avoir des tarifs plus abordables. |
|
397 |
Ce modèle de facturation nécessite deux choses : la première est d'avoir des équipements de mesures de la consommation énergétique, et la seconde de pouvoir assigner ces "mesures" à un utilisateur particulier. Les environnements mono-tenancy se prêtent bien à cette opération, car il n'y a pas besoin de recourir à des estimations de la consommation des VMs, qui pourraient être remises en question. |
|
398 |
Kwapi, le framework de remontée énergétique, ne connait pas quel utilisateur était assigné à telle machine à un moment donné. |
|
399 |
Ces valeurs sont stockées dans Ceilometer collector, et il serait souhaitable de les assigner aux clients avant leur stockage, afin qu'ils puissent librement interroger l'API de Ceilometer et retrouver leur consommation énergétique. De plus, cette assignation n'a besoin de se faire qu'une seule fois. |
|
400 |
Nous avons donc créé un module logiciel qui se branche sur le bus de Ceilometer, et modifie à la volée les métriques remontée, en leur assignant un propriétaire. Pour cela, il interroge le calendrier de réservation de Climate. |
|
401 |
En revanche se trouve dans Climate le calendrier de réservation. |
|
402 |
Dans le cas de réservations non réservés, et donc en environnement potentiellement multi-tenancy, on ne réalise aucune assignation, et on ne rend pas non plus accessible la consommation des machines concernées, car cela dévoilerait l'activité des autres utilisateurs. |
|
403 | 440 |
|
404 |
\section{Limitations} |
|
405 |
Nous pouvons identifier deux types de limitations : celles inhérentes au système de réservation, et celles portant sur des éléments techniques susceptibles d'évoluer. |
|
406 | 441 |
|
407 | 442 |
Il serait souhaitable de donner des conseils de placement à l'utilisateur, pour diminuer sa facture, ou honorer une requête trop contraignante. Cependant, il ne faut pas révéler trop d'éléments sur le datacenter. |
408 | 443 |
|
Formats disponibles : Unified diff