Un sistema de conversión de texto a habla requiere el diseño y la conexión de módulos de procesamiento lingüístico y de tratamiento de señal. En aquellos sistemas basados en la concatenación de segmentos de voz, la calidad de la voz resultante depende en buena medida del diseño del diccionario de unidades acústicas que se han grabado y almacenado. En este trabajo se presentan las opciones metodológicas utilizadas más comúnmente en la constitución de un inventario de unidades acústicas para la síntesis de habla. Las etapas (definición de las unidades de síntesis, diseño del corpus de grabación, selección del locutor) se abordan teniendo en cuenta la descripción del sistema fonético y fonológico del español, de tal modo que se demuestra que aunque sea una tarea eminentemente aplicada debe conjugarse con la reflexión teórica.