Combinações convexas de matrizes de densidade

Seleções probabilísticas de matrizes de densidade

Um aspecto fundamental das matrizes de densidade é que seleções probabilísticas de estados quânticos são representadas por combinações convexas das matrizes de densidade associadas a esses estados.

Por exemplo, se temos duas matrizes de densidade, $\rho$ e $\sigma,$ representando estados quânticos de um sistema $\mathsf{X},$ e preparamos o sistema no estado $\rho$ com probabilidade $p$ e no estado $\sigma$ com probabilidade $1 - p,$ então o estado quântico resultante é representado pela matriz de densidade

p \rho + (1 - p) \sigma.

De forma mais geral, se temos $m$ estados quânticos representados por matrizes de densidade $\rho_0,\ldots,\rho_{m-1},$ e um sistema é preparado no estado $\rho_k$ com probabilidade $p_k$ para algum vetor de probabilidade $(p_0,\ldots,p_{m-1}),$ o estado resultante é representado pela matriz de densidade

\sum_{k = 0}^{m-1} p_k \rho_k.

Isso é uma combinação convexa das matrizes de densidade $\rho_0,\ldots,\rho_{m-1}.$

Segue-se que se temos $m$ vetores de estado quântico $\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle,$ e preparamos um sistema no estado $\vert\psi_k\rangle$ com probabilidade $p_k$ para cada $k\in\{0,\ldots,m-1\},$ o estado obtido é representado pela matriz de densidade

\sum_{k = 0}^{m-1} p_k \vert\psi_k\rangle\langle\psi_k\vert.

Por exemplo, se um qubit é preparado no estado $\vert 0\rangle$ com probabilidade $1/2$ e no estado $\vert + \rangle$ com probabilidade $1/2,$ a representação em matriz de densidade do estado obtido é dada por

\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}.

Na formulação simplificada da informação quântica, fazer a média de vetores de estado quântico dessa forma não funciona. Por exemplo, o vetor

\frac{1}{2} \vert 0\rangle + \frac{1}{2} \vert + \rangle = \frac{1}{2} \begin{pmatrix}1\\[1mm] 0\end{pmatrix} + \frac{1}{2} \begin{pmatrix}\frac{1}{\sqrt{2}}\\[2mm]\frac{1}{\sqrt{2}}\end{pmatrix} = \begin{pmatrix}\frac{2 + \sqrt{2}}{4}\\[2mm]\frac{\sqrt{2}}{4}\end{pmatrix}

não é um vetor de estado quântico válido porque sua norma euclidiana não é igual a $1.$ Um exemplo mais extremo que mostra que isso não funciona para vetores de estado quântico: fixamos qualquer vetor de estado quântico $\vert\psi\rangle$ que queiramos, e então tomamos nosso estado como sendo $\vert\psi\rangle$ com probabilidade $1/2$ e $-\vert\psi\rangle$ com probabilidade $1/2.$ Esses estados diferem por uma fase global, então são na verdade o mesmo estado — mas fazer a média nos dá o vetor zero, que não é um vetor de estado quântico válido.

O estado completamente misto

Suponha que definimos o estado de um qubit como $\vert 0\rangle$ ou $\vert 1\rangle$ aleatoriamente, cada um com probabilidade $1/2.$ A matriz de densidade que representa o estado resultante é a seguinte.

\frac{1}{2} \vert 0\rangle\langle 0\vert + \frac{1}{2} \vert 1\rangle\langle 1\vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} 0 & 0\\[1mm] 0 & 1 \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[1mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

(Nessa equação, o símbolo $\mathbb{I}$ denota a matriz identidade $2\times 2$ .) Esse é um estado especial conhecido como o estado completamente misto. Ele representa incerteza total sobre o estado de um qubit, semelhante a um bit aleatório uniforme no contexto probabilístico.

Agora suponha que mudamos o procedimento: em vez dos estados $\vert 0\rangle$ e $\vert 1\rangle$ , usaremos os estados $\vert + \rangle$ e $\vert - \rangle.$ Podemos calcular a matriz de densidade que descreve o estado resultante de forma similar.

\frac{1}{2} \vert +\rangle\langle +\vert + \frac{1}{2} \vert -\rangle\langle -\vert = \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & -\frac{1}{2}\\[2mm] -\frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[2mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

É a mesma matriz de densidade de antes, mesmo tendo mudado os estados. Na verdade, obteríamos o mesmo resultado — o estado completamente misto — substituindo quaisquer dois vetores de estado de qubit ortogonais por $\vert 0\rangle$ e $\vert 1\rangle.$

Isso é uma característica, não um bug! De fato obtemos exatamente o mesmo estado de qualquer forma. Ou seja, não há como distinguir os dois procedimentos medindo o qubit que eles produzem, nem mesmo de forma estatística. Nossos dois procedimentos distintos são simplesmente formas diferentes de preparar esse estado.

Podemos verificar que isso faz sentido pensando no que poderíamos esperar aprender dado uma seleção aleatória de um estado de um dos dois possíveis conjuntos de estados $\{\vert 0\rangle,\vert 1\rangle\}$ e $\{\vert +\rangle,\vert -\rangle\}.$ Para simplificar, vamos supor que realizamos uma operação unitária $U$ em nosso qubit e depois medimos na base padrão.

No primeiro cenário, o estado do qubit é escolhido uniformemente do conjunto $\{\vert 0\rangle,\vert 1\rangle\}.$ Se o estado é $\vert 0\rangle,$ obtemos os resultados $0$ e $1$ com probabilidades

\vert \langle 0 \vert U \vert 0 \rangle \vert^2 \quad\text{e}\quad \vert \langle 1 \vert U \vert 0 \rangle \vert^2

respectivamente. Se o estado é $\vert 1\rangle,$ obtemos os resultados $0$ e $1$ com probabilidades

\vert \langle 0 \vert U \vert 1 \rangle \vert^2 \quad\text{e}\quad \vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Como as duas possibilidades ocorrem cada uma com probabilidade $1/2,$ obtemos o resultado $0$ com probabilidade

\frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2

e o resultado $1$ com probabilidade

\frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Ambas as expressões são iguais a $1/2.$ Uma forma de argumentar isso é usar um resultado de álgebra linear que pode ser visto como uma generalização do teorema de Pitágoras.

Teorema

Suponha que $\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\}$ é uma base ortonormal de um espaço vetorial (real ou complexo) $\mathcal{V}.$ Para todo vetor $\vert \phi\rangle \in \mathcal{V}$ temos $\vert \langle \psi_1\vert\phi\rangle\vert^2 + \cdots + \vert \langle \psi_n \vert \phi \rangle\vert^2 = \| \vert\phi\rangle \|^2.$

Podemos aplicar esse teorema para determinar as probabilidades da seguinte forma. A probabilidade de obter $0$ é

\begin{aligned} \frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \vert \langle 0 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 0 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 \end{aligned}

e a probabilidade de obter $1$ é

\begin{aligned} \frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 1 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 1 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2. \end{aligned}

Como $U$ é unitário, sabemos que $U^{\dagger}$ também é unitário, o que implica que tanto $U^{\dagger} \vert 0 \rangle$ quanto $U^{\dagger} \vert 1 \rangle$ são vetores unitários. Ambas as probabilidades são portanto iguais a $1/2.$ Isso significa que independentemente de como escolhemos $U,$ vamos simplesmente obter um bit aleatório uniforme da medição.

Podemos realizar uma verificação similar para qualquer outro par de estados ortonormais no lugar de $\vert 0\rangle$ e $\vert 1\rangle.$ Por exemplo, como $\{\vert + \rangle, \vert - \rangle\}$ é uma base ortonormal, a probabilidade de obter o resultado de medição $0$ no segundo procedimento é

\frac{1}{2}\vert \langle 0 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 = \frac{1}{2}

e a probabilidade de obter $1$ é

\frac{1}{2}\vert \langle 1 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2 = \frac{1}{2}.

Em particular, obtemos exatamente as mesmas estatísticas de saída que obtivemos para os estados $\vert 0\rangle$ e $\vert 1\rangle.$

Estados probabilísticos

Estados clássicos podem ser representados por matrizes de densidade. Em particular, para cada estado clássico $a$ de um sistema $\mathsf{X},$ a matriz de densidade

\rho = \vert a\rangle \langle a \vert

representa $\mathsf{X}$ estando definitivamente no estado clássico $a.$ Para qubits temos

\vert 0\rangle \langle 0 \vert = \begin{pmatrix}1 & 0 \\ 0 & 0\end{pmatrix} \quad\text{e}\quad \vert 1\rangle \langle 1 \vert = \begin{pmatrix}0 & 0 \\ 0 & 1\end{pmatrix},

e em geral temos um único $1$ na diagonal na posição correspondente ao estado clássico que temos em mente, com todas as demais entradas iguais a zero.

Podemos então tomar combinações convexas dessas matrizes de densidade para representar estados probabilísticos. Supondo por simplicidade que nosso conjunto de estados clássicos é $\{0,\ldots,n-1\},$ se $\mathsf{X}$ está no estado $a$ com probabilidade $p_a$ para cada $a\in\{0,\ldots,n-1\},$ então a matriz de densidade que obtemos é

\rho = \sum_{a = 0}^{n-1} p_a \vert a\rangle \langle a \vert = \begin{pmatrix} p_0 & 0 & \cdots & 0\\ 0 & p_1 & \ddots & \vdots\\ \vdots & \ddots & \ddots & 0\\ 0 & \cdots & 0 & p_{n-1} \end{pmatrix}.

No sentido inverso, qualquer matriz de densidade diagonal pode ser naturalmente identificada com o estado probabilístico que obtemos simplesmente lendo o vetor de probabilidades a partir da diagonal.

Para ficar claro, quando uma matriz de densidade é diagonal, não é necessariamente o caso de que estamos falando de um sistema clássico, ou que o sistema deva ter sido preparado por meio da seleção aleatória de um estado clássico, mas sim que o estado poderia ter sido obtido por meio da seleção aleatória de um estado clássico.

O fato de que estados probabilísticos são representados por matrizes de densidade diagonais é consistente com a intuição sugerida no início da lição de que as entradas fora da diagonal descrevem o grau em que os dois estados clássicos correspondentes à linha e à coluna daquela entrada estão em superposição quântica. Aqui, todas as entradas fora da diagonal são zero, portanto temos apenas aleatoriedade clássica e nada está em superposição quântica.

Matrizes de densidade e o teorema espectral

Vimos que se tomarmos uma combinação convexa de estados puros,

\rho = \sum_{k = 0}^{m-1} p_k \vert \psi_k\rangle \langle \psi_k \vert,

obtemos uma matriz de densidade. Toda matriz de densidade $\rho,$ na verdade, pode ser expressa como uma combinação convexa de estados puros dessa forma. Ou seja, sempre existirá uma coleção de vetores unitários $\{\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle\}$ e um vetor de probabilidade $(p_0,\ldots,p_{m-1})$ para os quais a equação acima é verdadeira.

Podemos, além disso, sempre escolher o número $m$ de modo que ele coincida com o número de estados clássicos do sistema em questão, e podemos selecionar os vetores de estado quântico de forma que sejam ortogonais. O teorema espectral, que encontramos no curso "Fundamentos de algoritmos quânticos", nos permite concluir isso. Aqui está uma reapresentação do teorema espectral para referência.

Teorema

Teorema espectral: Seja $M$ uma matriz complexa normal de ordem $n\times n$ . Existe uma base ortonormal de vetores complexos $n$ -dimensionais $\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle \}$ juntamente com números complexos $\lambda_0,\ldots,\lambda_{n-1}$ tais que

M = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert.

(Lembre que uma matriz $M$ é normal se satisfaz $M^{\dagger} M = M M^{\dagger}.$ Em palavras, matrizes normais são matrizes que comutam com sua própria transposta conjugada.)

Podemos aplicar o teorema espectral a qualquer matriz de densidade $\rho$ dada, pois matrizes de densidade são sempre Hermitianas e portanto normais. Isso nos permite escrever

\rho = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert

para alguma base ortonormal $\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle\}.$ Resta verificar que $(\lambda_0,\ldots,\lambda_{n-1})$ é um vetor de probabilidade, que podemos então renomear como $(p_0,\ldots,p_{n-1})$ se quisermos.

Os números $\lambda_0,\ldots,\lambda_{n-1}$ são os autovalores de $\rho,$ e como $\rho$ é semidefinida positiva, esses números devem portanto ser números reais não negativos. Podemos concluir que $\lambda_0 + \cdots + \lambda_{n-1} = 1$ a partir do fato de que $\rho$ tem traço igual a $1.$ Percorrer os detalhes nos dará a oportunidade de destacar a seguinte propriedade importante e muito útil do traço.

Teorema

Propriedade cíclica do traço: Para quaisquer duas matrizes $A$ e $B$ que nos dão uma matriz quadrada $AB$ ao multiplicar, a igualdade $\operatorname{Tr}(AB) = \operatorname{Tr}(BA)$ é verdadeira.

Note que esse teorema funciona mesmo quando $A$ e $B$ não são individualmente matrizes quadradas. Ou seja, podemos ter $A$ de ordem $n\times m$ e $B$ de ordem $m\times n,$ para alguma escolha de inteiros positivos $n$ e $m,$ de modo que $AB$ é uma matriz quadrada $n\times n$ e $BA$ é uma matriz $m\times m.$

Em particular, se deixarmos $A$ ser um vetor coluna $\vert\phi\rangle$ e $B$ ser o vetor linha $\langle \phi\vert,$ então vemos que

\operatorname{Tr}\bigl(\vert\phi\rangle\langle\phi\vert\bigr) = \operatorname{Tr}\bigl(\langle\phi\vert\phi\rangle\bigr) = \langle\phi\vert\phi\rangle.

A segunda igualdade segue do fato de que $\langle\phi\vert\phi\rangle$ é um escalar, que podemos também pensar como uma matriz $1\times 1$ cujo traço é sua única entrada. Usando esse fato, podemos concluir que $\lambda_0 + \cdots + \lambda_{n-1} = 1$ pela linearidade da função traço.

\begin{gathered} 1 = \operatorname{Tr}(\rho) = \operatorname{Tr}\bigl(\lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr)\\[2mm] = \lambda_0 \operatorname{Tr}\bigl(\vert \psi_0\rangle\langle \psi_0\vert\bigr) + \cdots + \lambda_{n-1} \operatorname{Tr}\bigl(\vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr) = \lambda_0 + \cdots + \lambda_{n-1} \end{gathered}

Alternativamente, podemos chegar à mesma conclusão usando o fato de que o traço de uma matriz quadrada (mesmo uma que não seja normal) é igual à soma de seus autovalores.

Concluímos, portanto, que qualquer matriz de densidade $\rho$ dada pode ser expressa como uma combinação convexa de estados puros. Vemos também que podemos, além disso, tomar os estados puros como sendo ortogonais. Isso significa, em particular, que nunca precisamos que o número $n$ seja maior que o tamanho do conjunto de estados clássicos de $\mathsf{X}.$

Em geral, deve-se entender que haverá diferentes formas de escrever uma matriz de densidade como uma combinação convexa de estados puros, não apenas as formas que o teorema espectral fornece. Um exemplo anterior ilustra isso.

\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}

Esta não é uma decomposição espectral dessa matriz porque $\vert 0\rangle$ e $\vert + \rangle$ não são ortogonais. Aqui está uma decomposição espectral:

\begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix} = \cos^2(\pi/8) \vert \psi_{\pi/8} \rangle \langle \psi_{\pi/8}\vert + \sin^2(\pi/8) \vert \psi_{5\pi/8} \rangle \langle \psi_{5\pi/8}\vert,

onde $\vert \psi_{\theta} \rangle = \cos(\theta)\vert 0\rangle + \sin(\theta)\vert 1\rangle.$ Os autovalores são números que provavelmente parecerão familiares:

\cos^2(\pi/8) = \frac{2+\sqrt{2}}{4} \approx 0.85 \quad\text{e}\quad \sin^2(\pi/8) = \frac{2-\sqrt{2}}{4} \approx 0.15.

Os autovetores podem ser escritos explicitamente assim.

\begin{aligned} \vert\psi_{\pi/8}\rangle & = \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 - \sqrt{2}}}{2}\vert 1\rangle \\[3mm] \vert\psi_{5\pi/8}\rangle & = -\frac{\sqrt{2 - \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 1\rangle \end{aligned}

Como outro exemplo mais geral, suponha que $\vert \phi_0\rangle,\ldots,\vert \phi_{99} \rangle$ são vetores de estado quântico representando estados de um único qubit, escolhidos arbitrariamente — portanto não estamos assumindo nenhuma relação particular entre esses vetores. Poderíamos então considerar o estado que obtemos escolhendo um desses $100$ estados uniformemente ao acaso:

\rho = \frac{1}{100} \sum_{k = 0}^{99} \vert \phi_k\rangle\langle \phi_k \vert.

Como estamos falando de um qubit, a matriz de densidade $\rho$ é $2\times 2,$ então pelo teorema espectral poderíamos alternativamente escrever

\rho = p \vert\psi_0\rangle\langle\psi_0\vert + (1 - p) \vert\psi_1\rangle\langle\psi_1\vert

para algum número real $p\in[0,1]$ e uma base ortonormal $\{\vert\psi_0\rangle,\vert\psi_1\rangle\}$ — mas naturalmente a existência dessa expressão não nos proíbe de escrever $\rho$ como uma média de 100 estados puros caso optemos por fazer isso.

Seleções probabilísticas de matrizes de densidade​

O estado completamente misto​

Estados probabilísticos​

Matrizes de densidade e o teorema espectral​

Seleções probabilísticas de matrizes de densidade

O estado completamente misto

Estados probabilísticos

Matrizes de densidade e o teorema espectral