Task Manager en profundidad

TASK MANAGER

 

Partimos de un Windows Server 2008 R2 y Exchange Server 2010 con todos los roles instalados


 

Overview Task Manager


Vamos a ir viendo pestaña por pestaña todas las opciones

 

CPU performance

 


Processes

Lista todos procesos que están usando recursos de CPU


  • Image.  El nombre del proceso que está consumiendo recursos de CPU.
  • PID. ID asociado al proceso.
  • Description. A short description that details the purpose of the process.
  • Status. El status del proceso en ejecución. El proceso es “running” o “terminated
  • Threads. Numero de hilos activos. Un hilo es una instancia única de proceso
  • CPU. El consume actual de CPU que esta hacienda el proceso
  • Average CPU: El consume de CPU por el proceso para el último minuto

 

Services

Lista cada servicio que está corriendo


 

  • Group. Service Group. Servicios que corren juntos en un grupo.


Associated Handles.

Aparece cuando se selecciona un proceso. Handles son punteros que referencian archivos, claves de registro, directories y otras cosas.

.

  • Type. Handle type. Mas informacion this TechNet article.
  • Handle Name.  Nombre del Handle asociado al proceso. .Podemos usar esto para buscar archivos claves de registro relacionadas.

 

Associated modules

Modules are helper files or programs, such as DLL files, used by processes to perform their tasks. You can use this section to further drill down when you’re looking into potential performance issues.


  • Module name. Name of the module loaded by the selected processes.
  • Version. The file version for the associated module.
  • Full Path. The full path to the module in use.

Graficos

Nos muestra métricas de rendimiento de cada CPU

  • CPU – Total:
    • Linea azul:
      muestra la frecuencia total de la CPU Ghz que se está usando
    • Line verde; Muestra la utilización de los recursos. En el ejemplo el 2% de la CPU



  • Service CPU usage: This graph indicates how much CPU horsepower is dedicated to background resources and processes.


  • CPU 0 – CPU 3 (some parked)

    Por cada CPU core nos muestra cuanta CPU esta en uso. Algunas CPU aparecen como “Parked”, el cual significa que esta apagadas temporalmente ya que no hay nada para hacer, por ejemplo cuando hay poca actividad

 


 

Memory usage

Podemos ejecutar Resmon.exe> Memory


Processes

Lista todos los procesos ejecutándose y divida los procesos en diversas categorías


The Processes table breaks down each process’ memory use in several categories.

  • Image: Muestra el nombre del ejecutable. Hay procesos representados por el nombre de la aplicación el cual es fácil identificar, pero otros procesos no.

  • PID: muestra el número de process ID
  • Commit: muestra la cantidad d memoria virtual en Kb que el Sistema operativo a reservado para el proceso (incluye la memoria física y cualquier página que se haya salvado en el archive de paginación por haberse quedado sin memoria)
  • Working Set: Muestra la cantidad de memoria física en kilobytes que está usando el proceso actualmente. El working set se divide en las categorías de Shareable y Private
  • Shareable: Memoria fisica en Kb que es usada por el proceso y compartida con otros procesos (de esta forma se ahorra espacio). Una ciopia de la memoria física es mapeada al espacio de la memoria virtual que otros procesos necesitan

    Cada proceso tiene un espacio de memoria virtual que la coge de la memoria física y la cual puede recibir mapeo compartidos. Por ejemplo system DLLs, such as Ntdll, Kernel32, Gdi32, and User32, comparten memoria para todos los procesos.

  • Private: memoria física usada por el proceso y que no comparte con otros procesos. Esto nos da una medida de la cantidad de memora física que una aplicación necesita a fin de poder ejecutarse
  • Hard Faults/sec: Numero de hard page faults por segundo que han ocurrido en el último minuto. Si un proceso intenta usar más memoria que la actualmente disponible, el sistema debe escribir (paginar) la memoria a disco (swapping). Cuando más tarde, el proceso accede a estas páginas del disco es lo que se llama Hard Fault

    Si el Hard Fault ocurre con frecuencia, las constantes lecturas a disco decrementaran el rendimiento del sistema

Physical Memory

Nos da un vistazo mas global del uso de la memora, en vez del granular de la sección porcesses



  • Hardware Reserved: Cantidad de memoria reservada para hardware (device hardware para comunicar con el sistema operativo). Tipicamente el rango se de 10MB a 70Mb, pero depende de la configuración del hardware. Por ejemplo se reserva para
    • System BIOS
    • Motherboard resources, such as I/O advanced programmable interrupt controller (APIC)
    • Sound cards or any other devices that require memory-mapped I/O
    • PCI Express (PCIe) bus
      • Video card, Various chipsets. Flash devices

         

  • In Use; La cantidad de memoria usada por el S.O, drivers y procesos. Es la suma de la modified + Standby + free exceptuando Hardware Reserved
  • Modified: Paginas de memoria que han sido modificadas pero hace tiempo que no han sido accedidas por nadie. Si pasa mucho tiempo el Memory Manager escribirá las paginas a disco y moverá estas páginas al Standby List
  • Standby: Paginas eliminadas del working set de los procesos, pero que aun están linkadas a sus respectivos working sets. Basicamente es una cache, y se priorizan en rangos de 0-7, siendo 7 la más alta

    Si un proceso necesita una página que está asociada con el proceso y está en la lista Standby, el gestor de memoria devuelve la página al working set del proceso. No obstante estas páginas en Standby estarán disponibles para asignarlas a cualquier proceso que lo necesite.

    Cuando un proceso necesite memoria y ya no haya en la Free list, entonces coge la memoria de la Standby List, cogiendo la de menor prioridad

  • Free: Son las páginas de memoria que no se han sido todavía asignadas a un proceso (zero page list) , o que lo fueron pero fueron devueltas cuando se terminó el proceso

     

Disk performance

Processes With Disk Activity

Esta ventana muestra una lista de todos los procesos activos que están usando recursos del disco. No es excesivamente util


  • Image. El nombre del proceso que está usando el disco activamente
  • PID. El ID asociado con el proceso.
    • Read (B/sec): media de numero bytes/sec leidos por el proceso en el último minuto
    • Write (B/sec): media de numero bytes/sec escritos por el proceso en el último minuto
    • Total (B/sec): media de la suma de lecturas y escrituras

Disk Activity

Esta sección proporciona información más útil. En particular response time metric


 

  • File: El archive que está siendo usado por el proceso
  • Read (B/sec). media de numero bytes/sec leidos por el proceso en el último minuto
  • Write (B/sec). media de numero bytes/sec leidos por el proceso en el último minuto
  • Total (B/sec): media de la suma de lecturas y escrituras
  • I/O Priority: The priority of I/O transfers.
  • Response Time (ms): Tiempo de respuesta del disco en milisegundos. Para esta métrica, cuanto más bajo, mejor. Un numero de 10 ms se considera buen rendimiento

    Si ocasionalmente va más allá de 10 ms puede estar OK, pero si está constantemente esperando más de 20 ms desde el Storage hay que mirarlo ya que puede implicar degradación de rendimiento. 50 ms o más es un problema serio. Vemos como en la primera imagen es de 5 o 6 ms (para un Exchange)

  • Hightest Active Time: porcentaje de tiempo transcurrido en el que el disco estaba ocupado leyendo o escribiendo solicitudes”. Es el mismo dato que el contador “PhysicalDisk_<Total %Time>:

    Si constantemente tiene niveles altos (+80%) es que hay un cuello de botella o que el disco no es muy rápido

 

En la derecha vemos un gráfico: nos muestra el ratio de transferencia entre el sistema y el Storage en el último minuto.

  • El color azul
    muestra la cantidad más alta del tiempo en el que está activo el disco (% Disk active Time)
  • El color verde
    muestra todo I/O de disco actual (cantidad de datos que está ahora mismo siendo transferido) también se puede interpretar como
    Disk Queue Length (las solicitudes en cola que esperan que el disco este libre)


 

Storage


  • Logical Disk. La letra asociada al disco
  • Physical disk. Que disco físico se está monitorizando
  • Active Time (%). El % de tiempo que el disco está sirviendo solicitudes activamente. Por ejemplo un 0.00 implica que el disco está completamente inactivo

    Si el disco está constantemente a niveles muy altos (80% o más) puede haber un cuello de botella relacionado con el almacenamiento. Si está al 100% podemos necesitar discos más rápidos o más cantidad de discos

  • Available Space (MB). How much disk space is available on the volume?
  • Total Space (MB). What is the total size of the volume?
  • Disk Queue Length.  muestra el número de solicitudes pendientes (read and write) en un momento dado.

    Un alto número indica que no hay suficientes ejes en el disco, para servir las necesidades de la aplicación, o que el almacenamiento es demasiado lento para atender a las solicitudes

    Cada disco que conforma un subsistema de Volumen en la SAN proporciona recursos que van a parar al disk queue length, es decir, a más discos, más alto será el disk queue length. Y para complicar, el nivel de RAID (0,1,5) y el tamaño del stripe puede afectar este valor

    • Si usamos un solo disco en el subsistema, y el queue length es constantemente mayor de 2, deberíamos añadir mas recursos
    • Más de 5 de queue length para un solo disco es un problema sería a resolver

Si sabemos cuántos discos tiene nuestro volumen, a groso modo, multiplicamos por 2 el número de discos para saber que tal Disk Queue Length tenemos. Si tenemos 10 discos en el sistema y una queue depth de 18, la cosa va bien. Es decir 10×2 = 20, y tenemos 18

 

Perfmon para ver si hay latencia en disco


  • Average disk queue length: número de procesos que están esperando para usar el disco (read, write). Escala 1

  • % Disk Time(uso del disco: uso es porcentaje del disco

Usar Disk Queue Length en conjunción con Disk Time (procesos esperando a usar el disco) nos dice cuanto se está usando el disco y si este uso es un problema

Por ejemplo. Si el Disk Time (% uso del disco) está al 40 %, pero el Average Disk Queue Length tiene un facto menor de 2, entonces el disco esta OK

Si el % disk time y average disk queue length estan altos (por encima 80 % disk time y mas de 2 de average disk queue length), significa que los procesos están esperando a que el disco este disponible, por lo que hay problemas de rendimiento

 

PERFORMANCE

Perfmon tiene 2 objetos relacionados con el rendimiento de disco; LogicalDisk y PhysicalDisk. Ambos se calculan de la misma forma pero el ámbito es distinto

  • Physical Disk: monitoriza los discos en la computadora. El contador reporta la suma de los accesos a todas las particiones del disco. Por ejemplo si un disco físico tiene 3 particiones (c:\, d:\, e:\). Nos reportara todo el disco, no por partición.
  • Logical Disk: Monitoriza particiones lógicas identificadas por sus letras o puntos de montaje (c:\, d:\, e:\). Si el disco físico tiene múltiples particiones, el contador solo reporta los valores de la partición seleccionado (la letra), en vez del disco entero.


Contadores

  • % Disk Time: Porcentaje de tiempo transcurrido en el que el disco a estado ocupado sirviendo solicitudes de lectura/escritura.

    No es más que el contador “Avg Disk Queue Length” pero multiplicado por 100, para que nos del porcentaje. Es el mismo valor pero con diferente escala.


Si el Avg Disk Queue Length es igual a 1, el % Disk Time será 100, es decir Avg Disk Que Length es 0.37 el % y el %Disk Time será 37


Esta es la razón de porque % Disk Time esta muchas veces por encima de 100%. Si cogemos las escalas por defecto (100 para disk queue y 1 para % Disk Time), cuando Avg Disk Queue Length es por ejemplo 2, el %disk time se ira a 200 %.


La misma lógica es para % Disk Read que toma su valor de Avg. Disk Read Queue y % Disk Write que toma su valor de Avg Disk Read Queue

  • Avg. Disk Queue Length:
    La media de número de solicitudes de lectura y escritura solicitadas y que fueron encoladas por el disco hasta que las pudo procesar. Por defecto es escala de 100. es igual a (Disk Transfer/sec) * (Disk sec/Transfer).

    Menos de 2 está bien. Si elegimos “_Total” es la latencia de todos los discos físicos/lógicos de la computadora

  • Disk Transfers/sec (Disk Reads/sec, Disk Writes/sec): número total de solicitudes I/O (read & write) de disco completado en un segundo. Disc Read/sec y Disk Write/sec se calculan de la misma forma, pero en resultados de lectura y en resultados de escritura


 

  • Disk Bytes/sec (Disk Read Bytes/sec, Disk Write Bytes/sec): el número de bytes enviados al disco (write) o recuperados desde el disco (read) en un segundo.


  • Avg. Disk Bytes/Transfer (Avg. Disk Bytes/Read, Avg. Disk Bytes/Write):
    La media de una solicitud de disco individual (IO size) en bytes. Por ejemplo si tenemos 99 I/O de 8k y una de 2048, la media será 28,4K. calculo= (8k*99) + (2048k*1) / 100
  • Avg. Disk sec/Transfer (Avg. Disk sec/Read, Avg. Disk sec/Write): se usa para medir la latencia de I/O (tiempo transcurrido desde que creo una disk IO request, hasta que la disk IO request se completó, es decir, la media en milisegundos que pasa desde que pido algo hasta que se completa

    El media de tiempo que tomo para hacer la transferencia de disco. L contador tiene una precisión de milisegundos, por lo que un valor de 0.007 indica que la media para la transferencia de disco fue de 4 milisegundos


 

 

 

Network performance

Muestra un servidor de producción ejecutando Windows Server 2008 R2 u Exchange Server 2010 con todos los roles instalados.


 

Processes With Network Activity

Muestra una lista de todos los procesos que estan usando recursos. No es de mucha ayuda.

  • Image. El nombre del proceso
  • PID. El ID asociado al proceso
  • Send (B/sec).  número de bytes por Segundo que el proceso ha enviado por la red en el último minuto. 138,430 bytes = 138Kb
  • Receive (B/sec). número de bytes por Segundo que el proceso ha recibido desde la red en el último minuto
  • Total (B/sec). media total de la actividad de red (en bytes) que el proceso a generado en el último minute (send + receive)

 

Network Activity


Nos da información útil para troubleshooting

  • Network I/O. muestra la utilización total actual de la red en Mbps
  • Network Utilization. Nos permite determinar la carga de la red. Si está en un 100 % de forma regular entonces hay congestión en la red y debemos añadir más capacidad de red, o ver cuál es el problema
  • Address.  El nombre o direccion IP con el cual el proceso está comunicando
  • Send (B/sec) y Receive (B/sec): los bytes por Segundo que envia o revibe el proceso

 

TCP Connections



  • Local Address: La IP local de nuestro Sistema. Muchos servidores tienen múltiples NIC e IP, aquí lo vemos más granular
  • Local Port.  El Puerto por el cual esta ocurrido la comunicación
  • Remote Address: cada conexión local requiere comunicación con el sitio remoto. Vemos el sitio remoto con el que se está comunicando
  • Remote Port. El Puerto remote
  • Packet Loss (%). Métrica clave. A más paquetes perdidos, peor calidad de conexión.
  • Latency (ms). Otra métrica clave. La latencia entre dos puntos, cuanto mas alta peor

 

Listening Ports


  • Address: algunos servicios están atadas a IP locales IPv4/IPv6. Si un servicio no está atada a una dirección especifica la columna mostrara: <IP version> unspecified.
  • Protocol. Protocolo que se está usando
  • Firewall Status: .Si el FW está bloqueando el trafico aquí lo veremos

 

Graficos

 

  • Network: ancho de banda usado en el último minuto para todas las conexiones
  • TCP Connections: muestra cuantas conexiones TCP se han creado: un numero alto de estas conexiones puede indicar un proceso fuera de control, spyware
  • Local Area Connection: muestra todo el uso de la red con un porcentaje


 

 


 

Be the first to comment

Leave a Reply