Pular para o conteúdo principal

Teorema de Naimark

O teorema de Naimark é um fato fundamental sobre medições. Ele afirma que toda medição geral pode ser implementada de uma forma simples que lembra as representações de Stinespring de canais:

  1. O sistema a ser medido é primeiro combinado com um sistema de workspace inicializado, formando um sistema composto.
  2. Uma operação unitária é então realizada no sistema composto.
  3. Por fim, o sistema de workspace é medido com respeito a uma medição na base padrão, produzindo o resultado da medição geral original.

Enunciado e prova do teorema

Seja X\mathsf{X} um sistema e seja {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} uma coleção de matrizes semidefinidas positivas satisfazendo

P0++Pm1=IX,P_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}},

ou seja, elas descrevem uma medição de X.\mathsf{X}. Seja também Y\mathsf{Y} um sistema cujo conjunto de estados clássicos é {0,,m1},\{0,\ldots,m-1\}, que é o conjunto de possíveis resultados dessa medição.

O teorema de Naimark afirma que existe uma operação unitária UU no sistema composto (Y,X)(\mathsf{Y},\mathsf{X}) tal que a implementação sugerida pela figura a seguir produz resultados de medição que concordam com a medição dada {P0,,Pm1},\{P_0,\ldots,P_{m-1}\}, ou seja, as probabilidades para os diferentes resultados de medição possíveis estão precisamente em acordo.

Uma implementação de uma medição geral como no teorema de Naimark

Para ficar claro, o sistema X\mathsf{X} começa em algum estado arbitrário ρ\rho enquanto Y\mathsf{Y} é inicializado no estado 0\vert 0\rangle. A operação unitária UU é aplicada a (Y,X)(\mathsf{Y},\mathsf{X}) e então o sistema Y\mathsf{Y} é medido com uma medição na base padrão, produzindo algum resultado a{0,,m1}.a\in\{0,\ldots,m-1\}.

O sistema X\mathsf{X} é representado como parte da saída do circuito, mas por ora não vamos nos preocupar com o estado de X\mathsf{X} após a aplicação de UU, e podemos imaginar que ele é traçado para fora. No entanto, vamos nos interessar pelo estado de X\mathsf{X} após UU ser aplicado mais adiante nesta lição.

Uma implementação de uma medição dessa forma é claramente reminiscente de uma representação de Stinespring de um canal, e os fundamentos matemáticos são similares também. A diferença aqui é que o sistema de workspace é medido em vez de ser traçado para fora, como no caso de uma representação de Stinespring.

O fato de que toda medição pode ser implementada dessa forma é bastante simples de provar, mas precisamos primeiro de um fato sobre matrizes semidefinidas positivas.

Fato

Suponha que PP é uma matriz semidefinida positiva n×nn \times n. Existe uma única matriz semidefinida positiva n×nn\times n QQ para a qual Q2=P.Q^2 = P. Essa única matriz semidefinida positiva é chamada de raiz quadrada de PP e é denotada P.\sqrt{P}.

Uma maneira de encontrar a raiz quadrada de uma matriz semidefinida positiva é primeiro calcular uma decomposição espectral.

P=k=0n1λkψkψkP = \sum_{k=0}^{n-1} \lambda_k \vert \psi_k \rangle \langle \psi_k \vert

Como PP é semidefinida positiva, seus autovalores devem ser números reais não negativos, e ao substituí-los por suas raízes quadradas obtemos uma expressão para a raiz quadrada de P.P.

P=k=0n1λkψkψk\sqrt{P} = \sum_{k=0}^{n-1} \sqrt{\lambda_k} \vert \psi_k \rangle \langle \psi_k \vert

Com esse conceito em mãos, estamos prontos para provar o teorema de Naimark. Assumindo que X\mathsf{X} tem nn estados clássicos, uma operação unitária UU no par (Y,X)(\mathsf{Y},\mathsf{X}) pode ser representada por uma matriz nm×nmnm\times nm, que podemos ver como uma matriz de blocos m×mm\times m cujos blocos são n×n.n\times n. A chave da prova é tomar UU como qualquer matriz unitária que corresponda ao seguinte padrão.

U=(P0??P1??Pm1??)U = \begin{pmatrix} \sqrt{P_0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \sqrt{P_1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

Para que seja possível preencher os blocos marcados com interrogação de modo que UU seja unitária, é necessário e suficiente que as primeiras nn colunas, formadas pelos blocos P0,,Pm1,\sqrt{P_0},\ldots,\sqrt{P_{m-1}}, sejam ortonormais. Podemos então usar o processo de ortonormalização de Gram-Schmidt para preencher as colunas restantes, como vimos na lição anterior.

As primeiras nn colunas de UU podem ser expressas como vetores da seguinte forma, onde c=0,,n1c = 0,\ldots,n-1 se refere ao número da coluna começando do 0.0.

γc=a=0m1aPac\vert\gamma_c\rangle = \sum_{a = 0}^{m-1} \vert a \rangle \otimes \sqrt{P_a} \vert c\rangle

Podemos calcular o produto interno entre quaisquer dois deles da seguinte forma.

γcγd=a,b=0m1abcPaPbd=c(a=0m1Pa)d=cd\langle \gamma_c \vert \gamma_d \rangle = \sum_{a,b = 0}^{m-1} \langle a \vert b \rangle \cdot \langle c \vert \sqrt{P_a}\sqrt{P_b}\, \vert d\rangle = \langle c \vert \Biggl(\sum_{a = 0}^{m-1} P_a \Biggr) \vert d\rangle = \langle c \vert d\rangle

Isso mostra que essas colunas são de fato ortonormais, então podemos preencher as colunas restantes de UU de uma forma que garante que a matriz inteira seja unitária.

Resta verificar que as probabilidades de resultado da medição para a simulação são consistentes com a medição original. Para um dado estado inicial ρ\rho de X,\mathsf{X}, a medição descrita pela coleção {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} resulta em cada resultado a{0,,m1}a\in\{0,\ldots,m-1\} com probabilidade Tr(Paρ).\operatorname{Tr}(P_a \rho).

Para obter as probabilidades de resultado para a simulação, vamos primeiro dar o nome σ\sigma ao estado de (Y,X)(\mathsf{Y},\mathsf{X}) após UU ter sido aplicada. Esse estado pode ser expresso da seguinte forma.

σ=U(00ρ)U=a,b=0m1abPaρPb\sigma = U \bigl(\vert 0\rangle \langle 0 \vert \otimes \rho\bigr) U^{\dagger} = \sum_{a,b=0}^{m-1} \vert a\rangle \langle b \vert \otimes \sqrt{P_a} \rho \sqrt{P_b}

Equivalentemente, na forma de matriz de blocos, temos a seguinte equação.

σ=(P0??P1??Pm1??)(ρ00000000)(P0P1Pm1??????)=(P0ρP0P0ρPm1Pm1ρP0Pm1ρPm1)\begin{aligned} \sigma & = \begin{pmatrix} \sqrt{P_0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \sqrt{P_1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix} \begin{pmatrix} \rho & 0 & \cdots & 0 \\[1mm] 0 & 0 & \cdots & 0 \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] 0 & 0 & \cdots & 0 \end{pmatrix} \begin{pmatrix} \sqrt{P_0} & \sqrt{P_1} & \cdots & \sqrt{P_{m-1}} \\[1mm] \fbox{?} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \fbox{?} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}\\[5mm] & = \begin{pmatrix} \sqrt{P_0}\rho\sqrt{P_0} & \cdots & \sqrt{P_0}\rho\sqrt{P_{m-1}} \\[1mm] \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}}\rho\sqrt{P_0} & \cdots & \sqrt{P_{m-1}}\rho\sqrt{P_{m-1}} \end{pmatrix} \end{aligned}

Note que as entradas de UU nos blocos marcados com interrogação não têm influência no resultado, em virtude do fato de que estamos conjugando uma matriz da forma 00ρ\vert 0 \rangle \langle 0 \vert \otimes \rho — portanto, as entradas com interrogação são sempre multiplicadas por entradas zero de 00ρ\vert 0 \rangle \langle 0 \vert \otimes \rho quando o produto matricial é calculado.

Agora podemos analisar o que acontece quando uma medição na base padrão é realizada em Y.\mathsf{Y}. As probabilidades dos resultados possíveis são dadas pelas entradas diagonais do estado reduzido σY\sigma_{\mathsf{Y}} de Y.\mathsf{Y}.

σY=a,b=0m1Tr(PaρPb)ab\sigma_{\mathsf{Y}} = \sum_{a,b=0}^{m-1} \operatorname{Tr}\Bigl(\sqrt{P_a} \rho \sqrt{P_b}\Bigr) \vert a\rangle \langle b \vert

Em particular, usando a propriedade cíclica do traço, vemos que a probabilidade de obter um dado resultado a{0,,m1}a\in\{0,\ldots,m-1\} é a seguinte.

aσYa=Tr(PaρPa)=Tr(Paρ)\langle a \vert \sigma_{\mathsf{Y}} \vert a \rangle = \operatorname{Tr}\Bigl(\sqrt{P_a} \rho \sqrt{P_a}\Bigr) = \operatorname{Tr}(P_a \rho)

Isso coincide com a medição original, estabelecendo a correção da simulação.

Medições não destrutivas

Até agora nesta lição, nos preocupamos com medições destrutivas, onde a saída consiste apenas no resultado clássico da medição e não há especificação do estado quântico pós-medição do sistema que foi medido.

As medições não destrutivas, por outro lado, fazem exatamente isso. Especificamente, as medições não destrutivas descrevem não apenas as probabilidades dos resultados clássicos da medição, mas também o estado do sistema que foi medido condicionado a cada possível resultado. Note que o termo não destrutivo se refere ao sistema sendo medido, mas não necessariamente ao seu estado, que pode mudar significativamente como resultado da medição.

Em geral, para uma dada medição destrutiva, haverá múltiplas (na verdade, infinitamente muitas) medições não destrutivas que são compatíveis com a medição destrutiva dada, ou seja, as probabilidades dos resultados clássicos da medição coincidem precisamente com as da medição destrutiva. Portanto, não existe uma forma única de definir o estado quântico pós-medição de um sistema para uma dada medição.

Na verdade, é possível generalizar as medições não destrutivas ainda mais, de modo que elas produzam um resultado clássico da medição junto com uma saída de estado quântico de um sistema que não é necessariamente o mesmo que o sistema de entrada.

A noção de medição não destrutiva é uma abstração interessante e útil. No entanto, deve-se reconhecer que as medições não destrutivas sempre podem ser descritas como composições de canais e medições destrutivas — portanto, há um sentido em que a noção de medição destrutiva é a mais fundamental.

A partir do teorema de Naimark

Considere a simulação de uma medição geral como a que temos no teorema de Naimark. Uma forma simples de obter uma medição não destrutiva a partir dessa simulação é revelada pela figura anterior, onde o sistema X\mathsf{X} não é traçado para fora, mas faz parte da saída. Isso produz tanto um resultado clássico da medição a{0,,m1}a\in\{0,\ldots,m-1\} quanto um estado quântico pós-medição de X.\mathsf{X}.

Vamos descrever esses estados em termos matemáticos. Estamos assumindo que o estado inicial de X\mathsf{X} é ρ,\rho, de modo que após o sistema inicializado Y\mathsf{Y} ser introduzido e UU ser aplicada, temos que (Y,X)(\mathsf{Y},\mathsf{X}) está no estado

σ=U(00ρ)U=a,b=0m1abPaρPb.\sigma = U \bigl(\vert 0\rangle \langle 0 \vert \otimes \rho\bigr) U^{\dagger} = \sum_{a,b=0}^{m-1} \vert a\rangle \langle b \vert \otimes \sqrt{P_a} \rho \sqrt{P_b}.

As probabilidades para os diferentes resultados clássicos aparecerem são as mesmas de antes — elas não podem mudar em função de decidirmos ignorar ou não X.\mathsf{X}. Ou seja, obtemos cada a{0,,m1}a\in\{0,\ldots,m-1\} com probabilidade Tr(Paρ).\operatorname{Tr}(P_a \rho).

Condicionado ao resultado de medição aa ter sido obtido, o estado resultante de X\mathsf{X} é dado por esta expressão.

PaρPaTr(Paρ)\frac{\sqrt{P_a} \rho \sqrt{P_a}}{\operatorname{Tr}(P_a \rho)}

Uma forma de ver isso é representar uma medição na base padrão de Y\mathsf{Y} pelo canal completamente defasador Δm,\Delta_m, onde a saída do canal descreve os resultados clássicos da medição como matrizes de densidade (diagonais). Uma expressão do estado que obtemos é a seguinte.

a,b=0m1Δm(ab)PaρPb=a=0m1aaPaρPa.\sum_{a,b=0}^{m-1} \Delta_m(\vert a\rangle \langle b \vert) \otimes \sqrt{P_a} \rho \sqrt{P_b} = \sum_{a=0}^{m-1} \vert a\rangle \langle a \vert \otimes \sqrt{P_a} \rho \sqrt{P_a}.

Podemos então escrever esse estado como uma combinação convexa de estados produto,

a=0m1Tr(Paρ)aaPaρPaTr(Paρ),\sum_{a=0}^{m-1} \operatorname{Tr}(P_a \rho)\, \vert a\rangle \langle a \vert \otimes \frac{\sqrt{P_a} \rho \sqrt{P_a}}{\operatorname{Tr}(P_a \rho)},

o que é consistente com a expressão que obtivemos para o estado de X\mathsf{X} condicionado a cada possível resultado de medição.

A partir de uma representação de Kraus

Existem seleções alternativas para UU no contexto do teorema de Naimark que produzem as mesmas probabilidades de resultado de medição, mas dão estados de saída de X\mathsf{X} completamente diferentes.

Por exemplo, uma opção é substituir (IYV)U(\mathbb{I}_{\mathsf{Y}} \otimes V) U por U,U, onde VV é qualquer operação unitária em X.\mathsf{X}. A aplicação de VV a X\mathsf{X} comuta com a medição de Y\mathsf{Y}, portanto as probabilidades dos resultados clássicos não mudam, mas agora o estado de X\mathsf{X} condicionado ao resultado aa se torna

VPaρPaVTr(Paρ).\frac{V \sqrt{P_a} \rho \sqrt{P_a}V^{\dagger}}{\operatorname{Tr}(P_a \rho)}.

De forma mais geral, poderíamos substituir UU pela matriz unitária

(a=0m1aaVa)U\Biggl(\sum_{a=0}^{m-1} \vert a\rangle\langle a \vert \otimes V_a\Biggr) U

para qualquer escolha de operações unitárias V0,,Vm1V_0,\ldots,V_{m-1} em X.\mathsf{X}. Novamente, as probabilidades dos resultados clássicos não mudam, mas agora o estado de X\mathsf{X} condicionado ao resultado aa se torna

VaPaρPaVaTr(Paρ).\frac{V_a \sqrt{P_a} \rho \sqrt{P_a}V_a^{\dagger}}{\operatorname{Tr}(P_a \rho)}.

Uma forma equivalente de expressar essa liberdade está conectada com as representações de Kraus. Ou seja, podemos descrever uma medição não destrutiva de mm resultados de um sistema com nn estados clássicos por uma seleção de matrizes de Kraus n×nn\times n A0,,Am1A_0,\ldots,A_{m-1} satisfazendo a condição típica para matrizes de Kraus.

a=0m1AaAa=IX(1)\sum_{a = 0}^{m-1} A_a^{\dagger} A_a = \mathbb{I}_{\mathsf{X}} \tag{1}

Assumindo que o estado inicial de X\mathsf{X} é ρ,\rho, o resultado clássico da medição é aa com probabilidade

Tr(AaρAa)=Tr(AaAaρ)\operatorname{Tr}\bigl(A_a \rho A_a^{\dagger}\bigr) = \operatorname{Tr}\bigl(A_a^{\dagger} A_a \rho \bigr)

e condicionado ao resultado ser aa, o estado de X\mathsf{X} se torna

AaρAaTr(AaAaρ).\frac{A_a \rho A_a^{\dagger}}{\operatorname{Tr}(A_a^{\dagger}A_a \rho)}.

Note que isso é equivalente a escolher a operação unitária UU no teorema de Naimark da seguinte forma.

U=(A0??A1??Am1??)U = \begin{pmatrix} A_{0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] A_{1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] A_{m-1} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

Na lição anterior, observamos que as colunas formadas pelos blocos A0,,Am1A_0,\ldots,A_{m-1} são necessariamente ortogonais, em virtude da condição (1).(1).

Generalizações

Existem formas ainda mais gerais de formular medições não destrutivas do que as formas que discutimos. A noção de instrumento quântico (que não será descrita aqui) representa uma maneira de fazer isso.