Algoritmo de Lanczos Índice Método iterativo para encontrar valores propios Método de...


Álgebra lineal


algoritmo iterativoCornelius Lanczosmétodos iterativosvectores propiosnuméricamente establedescomposición en valores propios de una matrizerror de redondeoel algoritmo de Arnoldiproceso de Gram–Schmidtel algoritmo Householdersubespacio de Krylovalgoritmo de Arnoldimatrices hermitianasmatriz tridiagonalsemejanteEstabilidad numéricaalgoritmo QRARPACKPeter MontgomerykernelGF(2)indexación semántica latentealgoritmo HITSJon KleinbergPageRankFísica de la materia condensadahamiltonianassistemas de electrones fuertemente correlacionadosbiblioteca NAGMATLABGNU OctaveMatlabOctaveGaussian Belief Propagation Matlab PackageGraphLabPRIMME




El algoritmo de Lanczos es un algoritmo iterativo creado por Cornelius Lanczos,[1]​este es una adaptación de los métodos iterativos para encontrar los valores propios más útiles y vectores propios de un sistema lineal de dimensión n∗n{displaystyle n*n} realizando un número de operaciones, m{displaystyle m}, donde m{displaystyle m} es más pequeño que n{displaystyle n}.


Aunque computacionalmente eficiente, en principio, el método formulado inicialmente no era útil, debido a su inestabilidad numérica. En 1970, Ojalvo y Newman mostraron cómo hacer el método numéricamente estable.[2]​ Esto se logró utilizando un método para la corrección de los vectores a cualquier grado de precisión que, cuando no se realiza, produce una serie de vectores que están altamente contaminados por los asociados con las frecuencias naturales más bajas. En su trabajo original, estos autores también sugirieron cómo seleccionar un vector de partida (utilizan un generador de números aleatorios para seleccionar cada elemento del vector de partida) y propusieron un método determinado empíricamente para determinar m{displaystyle m}, el reducido número de vectores (debe ser seleccionado para ser de aproximadamente 1 ½ veces el número de valores propios exactos que se desea).


Poco después su trabajo fue seguido por más artículos[3][4]​ que también proporciaron un análisis del error cometido. En el año 1988, Ojalvo[5]​ produjo una historia más detallada de este algoritmo y una prueba de error eficiente para un valor propio. Actualmente, el método es ampliamente utilizado en una variedad de campos técnicos y ha dado lugar una serie de variantes.




Índice






  • 1 Método iterativo para encontrar valores propios


  • 2 Método de Lanczos


    • 2.1 El algoritmo


      • 2.1.1 Definiciones


      • 2.1.2 Iteración


      • 2.1.3 Encontrando valores y vectores propios




    • 2.2 Estabilidad Numérica




  • 3 Variantes


    • 3.1 Kernel sobre un cuerpo finito




  • 4 Aplicaciones


  • 5 Implementaciones


  • 6 Referencias


  • 7 Enlaces externos





Método iterativo para encontrar valores propios


El método iterativo para encontrar el mayor valor propio de una matriz A{displaystyle A,} puede resumirse señalando que si x0{displaystyle x_{0},} es un vector aleatorio y xn+1=Axn{displaystyle x_{n+1}=Ax_{n},}, entonces para un n{displaystyle n} grande límite xn/‖xn‖{displaystyle x_{n}/|x_{n}|} se acerca al vector propio normalizado correspondiente al valor propio más grande.


Si A=Udiag⁡i)U′{displaystyle A=Uoperatorname {diag} (sigma _{i})U',} es la descomposición en valores propios de una matriz de A{displaystyle A,}, entonces An=Udiag⁡in)U′{displaystyle A^{n}=Uoperatorname {diag} (sigma _{i}^{n})U'}. Como n{displaystyle n,} se hace grande, la matriz diagonal de valores propios estará acotada por el valor propio más grande(despreciando el caso en que el valor más grande este repetido ). Mientras, xn+1‖/‖xn‖{displaystyle |x_{n+1}|/|x_{n}|,} convergerán al mayor valor propio y xn/‖xn‖{displaystyle x_{n}/|x_{n}|,} al vector propio asociado. Si el mayor valor propio es múltiple, entonces xn{displaystyle x_{n},} convergerá a un vector en el subespacio generado por los vectores propios asociados con esos valores propios más grandes. Luego de haber encontrado el primer vector propio / valor, uno puede restringir sucesivamente el algoritmo para el espacio nulo (kernel) de los vectores propios conocidos para obtener el segundo mayor vector propio / valores y así sucesivamente.


En la práctica, este sencillo algoritmo no funciona muy bien para el cálculo de muchos de los vectores propios, ya que cualquier error de redondeo podría introducir ligeros cambios a los componentes de los vectores propios más significativos de nuevo en el cálculo, degradando la exactitud del cálculo.



Método de Lanczos


Durante el procedimiento de aplicación del método, al obtener el último valor propio An−1v{displaystyle A^{n-1}v}, también se obtiene una serie de vectores Ajv,j=0,1,⋯,n−2{displaystyle A^{j}v,,j=0,1,cdots ,n-2} los cuales son descartados. Como n{displaystyle n} es con frecuencia grande, puede que se tenga una gran cantidad de información que no se utilice. Los algoritmos más avanzados, Como el el algoritmo de Arnoldi, el algoritmo de Lanczos, guardan esta información y utilizan el proceso de Gram–Schmidt o el algoritmo Householder para ortogonalizar nuevamente en una base que abarca el subespacio de Krylov correspondiente a la matriz A{displaystyle A}.



El algoritmo


El algoritmo de Lanczos puede ser visto como un sistema simplificado del algoritmo de Arnoldi que se aplica a matrices hermitianas. El m−esimo{displaystyle m-esimo} paso del algoritmo transforma la matriz A{displaystyle A} en una matriz tridiagonal Tmm{displaystyle T_{mm}}; cuando m{displaystyle m} es igual a la dimensión de A{displaystyle A}, Tmm{displaystyle T_{mm}} es semejante a A{displaystyle A}.



Definiciones


Se quiere calcular la matriz tridiagonal y simétrica Tmm=Vm∗AVm.{displaystyle T_{mm}=V_{m}^{*}AV_{m}.}


Los elementos de la diagonal se denotan por αj=tjj{displaystyle alpha _{j}=t_{jj}}, Y los elementos fuera de la diagonal son denotados por βj=tj−1,j{displaystyle beta _{j}=t_{j-1,j}}.


Notar que tj−1,j=tj,j−1{displaystyle t_{j-1,j}=t_{j,j-1}}, debido a la simetría de la matriz.



Iteración


(Nota: siguiendo estos pasos solamente no se encontraran correctamente los valores y vectores propios. Se deben tener en cuenta más consideraciones para corregir errores numéricos. Ver la sección Estabilidad numérica.)


En principio, hay cuatro maneras de escribir el procedimiento de iteración. Paige[1972] y otros trabajos muestran que el siguiente procedimiento es el más estable numéricamente.[6][7]


 v1←{displaystyle v_{1}leftarrow ,} vector aleatorio con norma 1.
v0←0{displaystyle v_{0}leftarrow 0,}
β1←0{displaystyle beta _{1}leftarrow 0,}

 for j=1,2,⋯,m−1{displaystyle j=1,2,cdots ,m-1,}
wj←Avj{displaystyle w_{j}leftarrow Av_{j},}
αj←wj⋅vj{displaystyle alpha _{j}leftarrow w_{j}cdot v_{j},}
wj←wj−αjvj−βjvj−1{displaystyle w_{j}leftarrow w_{j}-alpha _{j}v_{j}-beta _{j}v_{j-1},}
βj+1←‖wj‖{displaystyle beta _{j+1}leftarrow left|w_{j}right|,}
vj+1←wj/βj+1{displaystyle v_{j+1}leftarrow w_{j}/beta _{j+1},}
endfor

 wm←Avm{displaystyle w_{m}leftarrow Av_{m},}
αm←wm⋅vm{displaystyle alpha _{m}leftarrow w_{m}cdot v_{m},}
return

Aquí, x⋅y{displaystyle xcdot y} representa el producto escalar de vectores x{displaystyle x} y y{displaystyle y}.


Después de la iteración, se obtiene la αj{displaystyle alpha _{j}} and βj{displaystyle beta _{j}} con los que se forma una matriz tridiagonal.


Tmm=(α20β3⋱βm−m−m−m0βm){displaystyle T_{mm}={begin{pmatrix}alpha _{1}&beta _{2}&&&&0\beta _{2}&alpha _{2}&beta _{3}&&&\&beta _{3}&alpha _{3}&ddots &&\&&ddots &ddots &beta _{m-1}&\&&&beta _{m-1}&alpha _{m-1}&beta _{m}\0&&&&beta _{m}&alpha _{m}\end{pmatrix}}}


Los vectores vj{displaystyle v_{j}} (vectores de Lanczos) generados sobre la marcha forman la matriz de transformación
Vm=(v1,v2,⋯,vm){displaystyle V_{m}=left(v_{1},v_{2},cdots ,v_{m}right)}, que es útil para el cálculo de los vectores propios (ver más abajo). En la práctica, se podría guardar en cada iteración (pero ocupa memoria), o se podría recalcular cuando se necesite, siempre y cuando se tenga el primer vector v1{displaystyle v_{1}}. En cada iteración del algoritmo realiza una multiplicación matriz-vector y otras operaciones de punto flotantes.



Encontrando valores y vectores propios


Después de que la matriz Tmm{displaystyle T_{mm}} es calculada, se pueden encontrar sus valores propios λi(m){displaystyle lambda _{i}^{(m)}} y sus correspondientes vectores propios ui(m){displaystyle u_{i}^{(m)}} (Por ejemplo, usando el algoritmo QR o Multiple Relatively Robust Representations (MRRR)). Los valores y vectores propios deT{displaystyle T} se pueden obtener en O(m2){displaystyle {mathcal {O}}(m^{2})} usando MRRR; si se quiere buscar solo los valores propios estos se calculan en O(m2){displaystyle {mathcal {O}}(m^{2})} usando bisección espectral.


Se puede demostrar que los valores propios son valores propios aproximados de la matriz original A{displaystyle A}.


Los vectores propios yi{displaystyle y_{i}} de A{displaystyle A} se pueden calcular yi=Vmui(m){displaystyle y_{i}=V_{m}u_{i}^{(m)}}, donde Vm{displaystyle V_{m}} es la matriz de transformación cuyos vectores columna son v1,v2,⋯,vm{displaystyle v_{1},v_{2},cdots ,v_{m}}.



Estabilidad Numérica


Estabilidad significa cuánto se verá afectado el algoritmo (es decir, se encontrara un resultado aproximado cercano al original) si hay pequeños errores numéricos introducidos y acumulados. Estabilidad numérica es el criterio central para juzgar la utilidad de una implementación de un algoritmo en un ordenador con redondeo.
Para el algoritmo de Lanczos, se puede demostrar que con una aritmética exacta’’, el conjunto de vectores v1,v2,⋯,vm+1{displaystyle v_{1},v_{2},cdots ,v_{m+1}} forman una base ortonormal, los valores y vectores propios encontrados son buenas aproximaciones a los de la matriz original. Sin embargo, en la práctica (como los cálculos se realizan en aritméticas de punto flotante donde la inexactitud es inevitable, la ortogonalidad se pierde rápidamente y en algunos casos el nuevo vector incluso podría ser linealmente dependiente del conjunto que ya está construido. Como resultado, algunos de los valores propios de la matriz tridiagonal resultante no son buenas aproximaciones para los de la matriz original. Por lo que, el algoritmo de Lanczos no es muy estable.


Los que usen el algoritmo deben ser capaz de encontrar y eliminar los valores propios "con errores". Las implementaciones prácticas del algoritmo de Lanczos van en tres direcciones para luchar contra este problema de estabilidad:[6][7]



  1. Prevenir la pérdida de ortogonalidad

  2. Recuperar la ortogonalidad después deque se genera la base.

  3. Después de indentificar los valores propios "con errores", eliminarlos.



Variantes


Existen variantes en el algoritmo de Lanczos donde los vectores involucrados son vectores columnas, matrices estrechas y las constantes de la normalización son pequeñas matrices cuadradas. Estos se llaman "bloques" y el algoritmo de Lanczos puede ser mucho más rápido en computadoras con un gran número de registros y tiempos de esfuerzo de memoria largos.


Muchas implementaciones del algoritmo de Lanczos reinician después de un cierto número de iteraciones. Una de las variaciones del reinicio más influyentes es el método de Lanczos con reinicio implícito,[8]​ que se implementa enARPACK.[9]​ Esto ha llevado a un número de otras variantes de reinicio tales como reinicio bidiagonalizado de Lanczos.[10]​ Otra variante de reinicio exitosa es el método Thick-Restart de Lanczos,[11]​ que se ha implementado en un paquete de software llamado TRLAN.[12]



Kernel sobre un cuerpo finito


En 1995, Peter Montgomery publicó un algoritmo, basado en el algoritmo de Lanczos para encontrar elementos del kernel de una gran matriz sparse sobre GF(2); ya que el conjunto de personas interesadas en matrices sparse de gran dimensión sobre cuerpos finitos y el conjunto de personas interesadas en los problemas de los valores propios más grandes, tienen pocas personas en común, esto es a menudo también llamado el algoritmo de Lanczos por bloques.



Aplicaciones


Los algoritmos Lanczos son muy atractivos porque la multiplicación por A{displaystyle A,} es la única operación lineal a gran escala. Dado que los motores de recuperación de texto implementan esta operación, el algoritmo Lanczos se puede aplicar de manera eficiente a los documentos de texto (ver indexación semántica latente). Los vectores propios son también importantes para los métodos de clasificación a gran escala tales como el algoritmo HITS desarrollado por Jon Kleinberg, o el PageRank algoritmo usado por Google.


Algoritmos de Lanczos también se utilizan en Física de la materia condensada como un método para resolver hamiltonianas de sistemas de electrones fuertemente correlacionados.[13]



Implementaciones


La biblioteca NAG contiene varias métodos[14]​ para la solución de sistemas lineales grandes y problemas de valores/vectores propios que utilizan el algoritmo de Lanczos.


MATLAB y GNU Octave vienen con ARPACK incorporado. Ambos analizan matrices usando la función eigs() (Matlab/Octave).


La implementación de Matlab del algoritmo de Lanczos (nota: problemas de precisión) está disponible como parte de la Gaussian Belief Propagation Matlab Package. El GraphLab[15]​ biblioteca de filtrado colaborativo incorpora una implementación paralelizada del algoritmo de Lanczos (en C ++) para multinúcleo.
La biblioteca PRIMME también implementa el algoritmo de Lanczos.



Referencias




  1. Lanczos, C. “An iteration method for the solution of the eigenvalue problem of linear differential and integral operators”, J. Res. Nat’l Bur. Std. 45, 225-282 (1950).


  2. Ojalvo, I.U. and Newman, M.,”Vibration modes of large structures by an automatic matrix-reduction method”, AIAA J., 8 (7), 1234-1239 (1970).


  3. Paige, C.C., “The computation of eigenvalues and eigenvectors of very large sparse matrices”, the U. of London Ph.D. thesis (1971).


  4. Paige, C.C., “Computational variants of the Lanczos method for the eigenproblem”, J. Inst. Maths Applics 10, 373-381 (1972).


  5. Ojalvo, I.U., “Origins and advantages of Lanczos vectors for large dynamic systems”, Proc. 6th Modal Analysis Conference (IMAC), Kissimmee, FL, 489-494 (1988).


  6. ab Cullum; Willoughby. Lanczos Algorithms for Large Symmetric Eigenvalue Computations 1. ISBN 0-8176-3058-9. 


  7. ab Yousef Saad. Numerical Methods for Large Eigenvalue Problems. ISBN 0-470-21820-7. 


  8. D. Calvetti, L. Reichel, and D.C. Sorensen (1994). «An Implicitly Restarted Lanczos Method for Large Symmetric Eigenvalue Problems». Electronic Transactions on Numerical Analysis 2: 1-21. 


  9. R. B. Lehoucq, D. C. Sorensen, and C. Yang (1998). ARPACK Users Guide: Solution of Large-Scale Eigenvalue Problems with Implicitly Restarted Arnoldi Methods. SIAM. doi:10.1137/1.9780898719628. 


  10. E. Kokiopoulou and C. Bekas and E. Gallopoulos (2004). «Computing smallest singular triplets with implicitly restarted Lanczos bidiagonalization». Appl. Numer. Math. 49: 39. doi:10.1016/j.apnum.2003.11.011. 


  11. Kesheng Wu and Horst Simon (2000). «Thick-Restart Lanczos Method for Large Symmetric Eigenvalue Problems». SIAM Journal on Matrix Analysis and Applications (SIAM) 22 (2): 602. doi:10.1137/S0895479898334605. 


  12. Kesheng Wu and Horst Simon (2001). «TRLan software package». 


  13. Chen, HY; Atkinson, W.A.; Wortis, R. (julio de 2011). «Disorder-induced zero-bias anomaly in the Anderson-Hubbard model: Numerical and analytical calculations». Physical Review B 84 (4). doi:10.1103/PhysRevB.84.045113. 


  14. The Numerical Algorithms Group. «Keyword Index: Lanczos». NAG Library Manual, Mark 23. Consultado el 9 de febrero de 2012. 


  15. GraphLab

    • Archivado el 14 de marzo de 2011 en la Wayback Machine.




Enlaces externos



  • Golub and van Loan give very good descriptions of the various forms of Lanczos algorithms in their book Matrix Computations

  • Andrew Ng et al., an analysis of PageRank


  • Lanczos and conjugate gradient methods B. A. LaMacchia and A. M. Odlyzko, Solving Large Sparse Linear Systems Over Finite Fields.




Popular posts from this blog

ORA-01691 (unable to extend lob segment) even though my tablespace has AUTOEXTEND onORA-01692: unable to...

Always On Availability groups resolving state after failover - Remote harden of transaction...

Circunscripción electoral de Guipúzcoa Referencias Menú de navegaciónLas claves del sistema electoral en...