Pular para o conteúdo principal

Combinações convexas de matrizes de densidade

Seleções probabilísticas de matrizes de densidade

Um aspecto fundamental das matrizes de densidade é que seleções probabilísticas de estados quânticos são representadas por combinações convexas das matrizes de densidade associadas a esses estados.

Por exemplo, se temos duas matrizes de densidade, ρ\rho e σ,\sigma, representando estados quânticos de um sistema X,\mathsf{X}, e preparamos o sistema no estado ρ\rho com probabilidade pp e no estado σ\sigma com probabilidade 1p,1 - p, então o estado quântico resultante é representado pela matriz de densidade

pρ+(1p)σ.p \rho + (1 - p) \sigma.

De forma mais geral, se temos mm estados quânticos representados por matrizes de densidade ρ0,,ρm1,\rho_0,\ldots,\rho_{m-1}, e um sistema é preparado no estado ρk\rho_k com probabilidade pkp_k para algum vetor de probabilidade (p0,,pm1),(p_0,\ldots,p_{m-1}), o estado resultante é representado pela matriz de densidade

k=0m1pkρk.\sum_{k = 0}^{m-1} p_k \rho_k.

Isso é uma combinação convexa das matrizes de densidade ρ0,,ρm1.\rho_0,\ldots,\rho_{m-1}.

Segue-se que se temos mm vetores de estado quântico ψ0,,ψm1,\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle, e preparamos um sistema no estado ψk\vert\psi_k\rangle com probabilidade pkp_k para cada k{0,,m1},k\in\{0,\ldots,m-1\}, o estado obtido é representado pela matriz de densidade

k=0m1pkψkψk.\sum_{k = 0}^{m-1} p_k \vert\psi_k\rangle\langle\psi_k\vert.

Por exemplo, se um qubit é preparado no estado 0\vert 0\rangle com probabilidade 1/21/2 e no estado +\vert + \rangle com probabilidade 1/2,1/2, a representação em matriz de densidade do estado obtido é dada por

1200+12++=12(1000)+12(12121212)=(34141414).\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}.

Na formulação simplificada da informação quântica, fazer a média de vetores de estado quântico dessa forma não funciona. Por exemplo, o vetor

120+12+=12(10)+12(1212)=(2+2424)\frac{1}{2} \vert 0\rangle + \frac{1}{2} \vert + \rangle = \frac{1}{2} \begin{pmatrix}1\\[1mm] 0\end{pmatrix} + \frac{1}{2} \begin{pmatrix}\frac{1}{\sqrt{2}}\\[2mm]\frac{1}{\sqrt{2}}\end{pmatrix} = \begin{pmatrix}\frac{2 + \sqrt{2}}{4}\\[2mm]\frac{\sqrt{2}}{4}\end{pmatrix}

não é um vetor de estado quântico válido porque sua norma euclidiana não é igual a 1.1. Um exemplo mais extremo que mostra que isso não funciona para vetores de estado quântico: fixamos qualquer vetor de estado quântico ψ\vert\psi\rangle que queiramos, e então tomamos nosso estado como sendo ψ\vert\psi\rangle com probabilidade 1/21/2 e ψ-\vert\psi\rangle com probabilidade 1/2.1/2. Esses estados diferem por uma fase global, então são na verdade o mesmo estado — mas fazer a média nos dá o vetor zero, que não é um vetor de estado quântico válido.

O estado completamente misto

Suponha que definimos o estado de um qubit como 0\vert 0\rangle ou 1\vert 1\rangle aleatoriamente, cada um com probabilidade 1/2.1/2. A matriz de densidade que representa o estado resultante é a seguinte.

1200+1211=12(1000)+12(0001)=(120012)=12I\frac{1}{2} \vert 0\rangle\langle 0\vert + \frac{1}{2} \vert 1\rangle\langle 1\vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} 0 & 0\\[1mm] 0 & 1 \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[1mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

(Nessa equação, o símbolo I\mathbb{I} denota a matriz identidade 2×22\times 2.) Esse é um estado especial conhecido como o estado completamente misto. Ele representa incerteza total sobre o estado de um qubit, semelhante a um bit aleatório uniforme no contexto probabilístico.

Agora suponha que mudamos o procedimento: em vez dos estados 0\vert 0\rangle e 1\vert 1\rangle, usaremos os estados +\vert + \rangle e .\vert - \rangle. Podemos calcular a matriz de densidade que descreve o estado resultante de forma similar.

12+++12=12(12121212)+12(12121212)=(120012)=12I\frac{1}{2} \vert +\rangle\langle +\vert + \frac{1}{2} \vert -\rangle\langle -\vert = \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & -\frac{1}{2}\\[2mm] -\frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[2mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

É a mesma matriz de densidade de antes, mesmo tendo mudado os estados. Na verdade, obteríamos o mesmo resultado — o estado completamente misto — substituindo quaisquer dois vetores de estado de qubit ortogonais por 0\vert 0\rangle e 1.\vert 1\rangle.

Isso é uma característica, não um bug! De fato obtemos exatamente o mesmo estado de qualquer forma. Ou seja, não há como distinguir os dois procedimentos medindo o qubit que eles produzem, nem mesmo de forma estatística. Nossos dois procedimentos distintos são simplesmente formas diferentes de preparar esse estado.

Podemos verificar que isso faz sentido pensando no que poderíamos esperar aprender dado uma seleção aleatória de um estado de um dos dois possíveis conjuntos de estados {0,1}\{\vert 0\rangle,\vert 1\rangle\} e {+,}.\{\vert +\rangle,\vert -\rangle\}. Para simplificar, vamos supor que realizamos uma operação unitária UU em nosso qubit e depois medimos na base padrão.

No primeiro cenário, o estado do qubit é escolhido uniformemente do conjunto {0,1}.\{\vert 0\rangle,\vert 1\rangle\}. Se o estado é 0,\vert 0\rangle, obtemos os resultados 00 e 11 com probabilidades

0U02e1U02\vert \langle 0 \vert U \vert 0 \rangle \vert^2 \quad\text{e}\quad \vert \langle 1 \vert U \vert 0 \rangle \vert^2

respectivamente. Se o estado é 1,\vert 1\rangle, obtemos os resultados 00 e 11 com probabilidades

0U12e1U12.\vert \langle 0 \vert U \vert 1 \rangle \vert^2 \quad\text{e}\quad \vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Como as duas possibilidades ocorrem cada uma com probabilidade 1/2,1/2, obtemos o resultado 00 com probabilidade

120U02+120U12\frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2

e o resultado 11 com probabilidade

121U02+121U12.\frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Ambas as expressões são iguais a 1/2.1/2. Uma forma de argumentar isso é usar um resultado de álgebra linear que pode ser visto como uma generalização do teorema de Pitágoras.

Teorema

Suponha que {ψ1,,ψn}\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\} é uma base ortonormal de um espaço vetorial (real ou complexo) V.\mathcal{V}. Para todo vetor ϕV\vert \phi\rangle \in \mathcal{V} temos ψ1ϕ2++ψnϕ2=ϕ2.\vert \langle \psi_1\vert\phi\rangle\vert^2 + \cdots + \vert \langle \psi_n \vert \phi \rangle\vert^2 = \| \vert\phi\rangle \|^2.

Podemos aplicar esse teorema para determinar as probabilidades da seguinte forma. A probabilidade de obter 00 é

120U02+120U12=12(0U02+0U12)=12(0U02+1U02)=12U02\begin{aligned} \frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \vert \langle 0 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 0 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 \end{aligned}

e a probabilidade de obter 11 é

121U02+121U12=12(1U02+1U12)=12(0U12+1U12)=12U12.\begin{aligned} \frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 1 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 1 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2. \end{aligned}

Como UU é unitário, sabemos que UU^{\dagger} também é unitário, o que implica que tanto U0U^{\dagger} \vert 0 \rangle quanto U1U^{\dagger} \vert 1 \rangle são vetores unitários. Ambas as probabilidades são portanto iguais a 1/2.1/2. Isso significa que independentemente de como escolhemos U,U, vamos simplesmente obter um bit aleatório uniforme da medição.

Podemos realizar uma verificação similar para qualquer outro par de estados ortonormais no lugar de 0\vert 0\rangle e 1.\vert 1\rangle. Por exemplo, como {+,}\{\vert + \rangle, \vert - \rangle\} é uma base ortonormal, a probabilidade de obter o resultado de medição 00 no segundo procedimento é

120U+2+120U2=12U02=12\frac{1}{2}\vert \langle 0 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 = \frac{1}{2}

e a probabilidade de obter 11 é

121U+2+121U2=12U12=12.\frac{1}{2}\vert \langle 1 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2 = \frac{1}{2}.

Em particular, obtemos exatamente as mesmas estatísticas de saída que obtivemos para os estados 0\vert 0\rangle e 1.\vert 1\rangle.

Estados probabilísticos

Estados clássicos podem ser representados por matrizes de densidade. Em particular, para cada estado clássico aa de um sistema X,\mathsf{X}, a matriz de densidade

ρ=aa\rho = \vert a\rangle \langle a \vert

representa X\mathsf{X} estando definitivamente no estado clássico a.a. Para qubits temos

00=(1000)e11=(0001),\vert 0\rangle \langle 0 \vert = \begin{pmatrix}1 & 0 \\ 0 & 0\end{pmatrix} \quad\text{e}\quad \vert 1\rangle \langle 1 \vert = \begin{pmatrix}0 & 0 \\ 0 & 1\end{pmatrix},

e em geral temos um único 11 na diagonal na posição correspondente ao estado clássico que temos em mente, com todas as demais entradas iguais a zero.

Podemos então tomar combinações convexas dessas matrizes de densidade para representar estados probabilísticos. Supondo por simplicidade que nosso conjunto de estados clássicos é {0,,n1},\{0,\ldots,n-1\}, se X\mathsf{X} está no estado aa com probabilidade pap_a para cada a{0,,n1},a\in\{0,\ldots,n-1\}, então a matriz de densidade que obtemos é

ρ=a=0n1paaa=(p0000p1000pn1).\rho = \sum_{a = 0}^{n-1} p_a \vert a\rangle \langle a \vert = \begin{pmatrix} p_0 & 0 & \cdots & 0\\ 0 & p_1 & \ddots & \vdots\\ \vdots & \ddots & \ddots & 0\\ 0 & \cdots & 0 & p_{n-1} \end{pmatrix}.

No sentido inverso, qualquer matriz de densidade diagonal pode ser naturalmente identificada com o estado probabilístico que obtemos simplesmente lendo o vetor de probabilidades a partir da diagonal.

Para ficar claro, quando uma matriz de densidade é diagonal, não é necessariamente o caso de que estamos falando de um sistema clássico, ou que o sistema deva ter sido preparado por meio da seleção aleatória de um estado clássico, mas sim que o estado poderia ter sido obtido por meio da seleção aleatória de um estado clássico.

O fato de que estados probabilísticos são representados por matrizes de densidade diagonais é consistente com a intuição sugerida no início da lição de que as entradas fora da diagonal descrevem o grau em que os dois estados clássicos correspondentes à linha e à coluna daquela entrada estão em superposição quântica. Aqui, todas as entradas fora da diagonal são zero, portanto temos apenas aleatoriedade clássica e nada está em superposição quântica.

Matrizes de densidade e o teorema espectral

Vimos que se tomarmos uma combinação convexa de estados puros,

ρ=k=0m1pkψkψk,\rho = \sum_{k = 0}^{m-1} p_k \vert \psi_k\rangle \langle \psi_k \vert,

obtemos uma matriz de densidade. Toda matriz de densidade ρ,\rho, na verdade, pode ser expressa como uma combinação convexa de estados puros dessa forma. Ou seja, sempre existirá uma coleção de vetores unitários {ψ0,,ψm1}\{\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle\} e um vetor de probabilidade (p0,,pm1)(p_0,\ldots,p_{m-1}) para os quais a equação acima é verdadeira.

Podemos, além disso, sempre escolher o número mm de modo que ele coincida com o número de estados clássicos do sistema em questão, e podemos selecionar os vetores de estado quântico de forma que sejam ortogonais. O teorema espectral, que encontramos no curso "Fundamentos de algoritmos quânticos", nos permite concluir isso. Aqui está uma reapresentação do teorema espectral para referência.

Teorema

Teorema espectral: Seja MM uma matriz complexa normal de ordem n×nn\times n. Existe uma base ortonormal de vetores complexos nn-dimensionais {ψ0,,ψn1}\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle \} juntamente com números complexos λ0,,λn1\lambda_0,\ldots,\lambda_{n-1} tais que

M=λ0ψ0ψ0++λn1ψn1ψn1.M = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert.

(Lembre que uma matriz MM é normal se satisfaz MM=MM.M^{\dagger} M = M M^{\dagger}. Em palavras, matrizes normais são matrizes que comutam com sua própria transposta conjugada.)

Podemos aplicar o teorema espectral a qualquer matriz de densidade ρ\rho dada, pois matrizes de densidade são sempre Hermitianas e portanto normais. Isso nos permite escrever

ρ=λ0ψ0ψ0++λn1ψn1ψn1\rho = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert

para alguma base ortonormal {ψ0,,ψn1}.\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle\}. Resta verificar que (λ0,,λn1)(\lambda_0,\ldots,\lambda_{n-1}) é um vetor de probabilidade, que podemos então renomear como (p0,,pn1)(p_0,\ldots,p_{n-1}) se quisermos.

Os números λ0,,λn1\lambda_0,\ldots,\lambda_{n-1} são os autovalores de ρ,\rho, e como ρ\rho é semidefinida positiva, esses números devem portanto ser números reais não negativos. Podemos concluir que λ0++λn1=1\lambda_0 + \cdots + \lambda_{n-1} = 1 a partir do fato de que ρ\rho tem traço igual a 1.1. Percorrer os detalhes nos dará a oportunidade de destacar a seguinte propriedade importante e muito útil do traço.

Teorema

Propriedade cíclica do traço: Para quaisquer duas matrizes AA e BB que nos dão uma matriz quadrada ABAB ao multiplicar, a igualdade Tr(AB)=Tr(BA)\operatorname{Tr}(AB) = \operatorname{Tr}(BA) é verdadeira.

Note que esse teorema funciona mesmo quando AA e BB não são individualmente matrizes quadradas. Ou seja, podemos ter AA de ordem n×mn\times m e BB de ordem m×n,m\times n, para alguma escolha de inteiros positivos nn e m,m, de modo que ABAB é uma matriz quadrada n×nn\times n e BABA é uma matriz m×m.m\times m.

Em particular, se deixarmos AA ser um vetor coluna ϕ\vert\phi\rangle e BB ser o vetor linha ϕ,\langle \phi\vert, então vemos que

Tr(ϕϕ)=Tr(ϕϕ)=ϕϕ.\operatorname{Tr}\bigl(\vert\phi\rangle\langle\phi\vert\bigr) = \operatorname{Tr}\bigl(\langle\phi\vert\phi\rangle\bigr) = \langle\phi\vert\phi\rangle.

A segunda igualdade segue do fato de que ϕϕ\langle\phi\vert\phi\rangle é um escalar, que podemos também pensar como uma matriz 1×11\times 1 cujo traço é sua única entrada. Usando esse fato, podemos concluir que λ0++λn1=1\lambda_0 + \cdots + \lambda_{n-1} = 1 pela linearidade da função traço.

1=Tr(ρ)=Tr(λ0ψ0ψ0++λn1ψn1ψn1)=λ0Tr(ψ0ψ0)++λn1Tr(ψn1ψn1)=λ0++λn1\begin{gathered} 1 = \operatorname{Tr}(\rho) = \operatorname{Tr}\bigl(\lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr)\\[2mm] = \lambda_0 \operatorname{Tr}\bigl(\vert \psi_0\rangle\langle \psi_0\vert\bigr) + \cdots + \lambda_{n-1} \operatorname{Tr}\bigl(\vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr) = \lambda_0 + \cdots + \lambda_{n-1} \end{gathered}

Alternativamente, podemos chegar à mesma conclusão usando o fato de que o traço de uma matriz quadrada (mesmo uma que não seja normal) é igual à soma de seus autovalores.

Concluímos, portanto, que qualquer matriz de densidade ρ\rho dada pode ser expressa como uma combinação convexa de estados puros. Vemos também que podemos, além disso, tomar os estados puros como sendo ortogonais. Isso significa, em particular, que nunca precisamos que o número nn seja maior que o tamanho do conjunto de estados clássicos de X.\mathsf{X}.

Em geral, deve-se entender que haverá diferentes formas de escrever uma matriz de densidade como uma combinação convexa de estados puros, não apenas as formas que o teorema espectral fornece. Um exemplo anterior ilustra isso.

1200+12++=(34141414)\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}

Esta não é uma decomposição espectral dessa matriz porque 0\vert 0\rangle e +\vert + \rangle não são ortogonais. Aqui está uma decomposição espectral:

(34141414)=cos2(π/8)ψπ/8ψπ/8+sin2(π/8)ψ5π/8ψ5π/8,\begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix} = \cos^2(\pi/8) \vert \psi_{\pi/8} \rangle \langle \psi_{\pi/8}\vert + \sin^2(\pi/8) \vert \psi_{5\pi/8} \rangle \langle \psi_{5\pi/8}\vert,

onde ψθ=cos(θ)0+sin(θ)1.\vert \psi_{\theta} \rangle = \cos(\theta)\vert 0\rangle + \sin(\theta)\vert 1\rangle. Os autovalores são números que provavelmente parecerão familiares:

cos2(π/8)=2+240.85esin2(π/8)=2240.15.\cos^2(\pi/8) = \frac{2+\sqrt{2}}{4} \approx 0.85 \quad\text{e}\quad \sin^2(\pi/8) = \frac{2-\sqrt{2}}{4} \approx 0.15.

Os autovetores podem ser escritos explicitamente assim.

ψπ/8=2+220+2221ψ5π/8=2220+2+221\begin{aligned} \vert\psi_{\pi/8}\rangle & = \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 - \sqrt{2}}}{2}\vert 1\rangle \\[3mm] \vert\psi_{5\pi/8}\rangle & = -\frac{\sqrt{2 - \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 1\rangle \end{aligned}

Como outro exemplo mais geral, suponha que ϕ0,,ϕ99\vert \phi_0\rangle,\ldots,\vert \phi_{99} \rangle são vetores de estado quântico representando estados de um único qubit, escolhidos arbitrariamente — portanto não estamos assumindo nenhuma relação particular entre esses vetores. Poderíamos então considerar o estado que obtemos escolhendo um desses 100100 estados uniformemente ao acaso:

ρ=1100k=099ϕkϕk.\rho = \frac{1}{100} \sum_{k = 0}^{99} \vert \phi_k\rangle\langle \phi_k \vert.

Como estamos falando de um qubit, a matriz de densidade ρ\rho é 2×2,2\times 2, então pelo teorema espectral poderíamos alternativamente escrever

ρ=pψ0ψ0+(1p)ψ1ψ1\rho = p \vert\psi_0\rangle\langle\psi_0\vert + (1 - p) \vert\psi_1\rangle\langle\psi_1\vert

para algum número real p[0,1]p\in[0,1] e uma base ortonormal {ψ0,ψ1}\{\vert\psi_0\rangle,\vert\psi_1\rangle\} — mas naturalmente a existência dessa expressão não nos proíbe de escrever ρ\rho como uma média de 100 estados puros caso optemos por fazer isso.