Mira, una analogía fácil, tu sabes dibujar? si sabes un poco ¿Cómo sería si te comparas con un dibujante profesional?, si le pidieras a él que dibujara una escena y tú la misma ¿Quién acabaría primero? y ¿si además tuvieras que planear la siguiente escena que se debe dibujar? por supuesto que te vendría bien una mano extra con ello ¿verdad?.
La GPU integrada no tiene tanto poder por que está pensada para una tarea básica, decodificar video, ejecutar efectos 3D ocasionales y 2D, las dedicadas tienen más poder para realizar cálculos 3D complejos, además poseen su propia interfaz de datos a la memoria, la CPU solo tiene 64bits para ello mientras que las GPU superan eso con interfaces de 256bits o más.
Mi notebook tiene 2 graficas como dices, la integrada Intel HD 3000 y la dedicada NVIDIA NVS 4200M, una está enfocada en bajo consumo, comparte la memoria de la RAM del sistema, y no puede hacer mucho pero basta para navegar en internet, ver películas y ejecutar algunos juegos simples, pero cuando necesito gráficos intensivos se retrasa con los cálculos, es ahí cuando entra en juego la dedicada.
Ciertamente las dos trabajan, pero solo una a la ves, cuando la otra necesita entrar en acción se conmutan y los datos pasan a la dedicada donde se procesan y luego son devueltos para visualizarse (excepto donde la dedicada controla la salida directamente), al final la IGP solo actúa como el buffer de visualización mientras los cálculos la realiza la GPU.
Si dices que si hay perdida de rendimiento por la gestión, si lo hay, pero el rendimiento de la GPU es superior al de la IGP, por lo que esa perdida de rendimiento resulta ser insignificante comparada a lo que esta tardaría en los cálculos, siguiendo la analogía de arriba, te tardarías en darle la hoja al dibujante, pero él acabaría el dibujo antes que tú al devolvértelo.
¿Por qué la IGP no puede ser más potente y eliminamos la necesidad de una GPU extra? el motivo es simple, el espacio, reducirlo al mismo chip significa limitar el número de conexiones eléctricas con el PCB, lo que limitará el ancho de banda de la memoria, eso significa un mayor retraso si consideramos que en realidad no es uno ni dos, sino decenas de procesadores los que tiene una GPU y todos queriendo acceder a la memoria tan pronto como les sea posible. Además el computo intensivo de estos incrementa el calor y sumándolos al del CPU será más difícil de gestionar que teniendo un segundo chip produciéndolo y poder enviarlo a una via alterna.