Sammanfattning
Alltför ofta i fastigheter kan värderingsprocessen uppfattas som en tumsugande övning med hög panna. Mäklaren kommer över, sparkar de ökända däcken och producerar sedan ett uppskattat värde med mycket liten "kvantitativ" insikt. Kanske förvärras processen av den känslomässiga fäste som ägandet av fastigheter medför, eftersom ett hus för många kommer att vara den största finansiella investeringen som gjorts under en livstid.
Ändå finns det en metod för denna galenskap. Tja, tre för att vara exakt.
Den jämförbara försäljningsmetoden är vanligast i bostadsfastigheter och använder nyligen genomförda försäljningar av liknande fastigheter för att fastställa värdet på en aktuell fastighet. Försäljningspriset för "komps" justeras baserat på skillnader mellan dem och den aktuella fastigheten. Till exempel, om en jämförbar fastighet har ett extra badrum, dras det uppskattade värdet av badrummet från dess observerade försäljningspris.
Kommersiella fastigheter anses vara mer heterogena, så den jämförbara försäljningsmetoden används mer sällan. Inkomstmetoden, baserad på konceptet att det inneboende värdet av en tillgång är ekvivalent med summan av alla dess diskonterade kassaflöden, tillämpas mer allmänt på två metoder:
Den sista tekniken är kostnadsmetoden, som uppskattar värdet baserat på kostnaden för att förvärva en identisk bit mark och bygga en kopia av den aktuella fastigheten. Därefter skrivs kostnaden för projektet av baserat på aktuellt inkuransläge för den aktuella fastigheten. I likhet med justeringarna i det jämförbara försäljningssättet är målet att nära matcha den aktuella fastigheten. Kostnadsmetoden används mer sällan än de andra två metoderna.
Alla traditionella fastighetsvärderingsmetoder är subjektiva, på grund av urvalet av de indata som används för värderingen. Till exempel, valet av takränta har en betydande inverkan på en fastighetsvärdering:när man värderar en fastighet med ett NOI på 1 miljoner USD kommer en ökning med 4 % i takräntan (från 6 % till 10 %) att minska värdet på fastigheten med 40 % (diagram nedan).
Det finns många fördelar med att använda regressionsmodeller för fastighetsvärdering. Detaljhandeln har anammat dess användning för platsval, men fastighetsbranschen har för det mesta förbisett dess potentiella fördelar. Regressionsanalys är särskilt lämplig för att analysera stora mängder data. Det skulle vara praktiskt taget omöjligt att ha en stark kunskap om alla lokala fastighetsmarknader i landet, men regressionsmodellering kan hjälpa till att begränsa sökningen.
Den största fördelen med att använda regressionsmodellering är dess inneboende flexibilitet - de kan fungera oberoende av andra modeller eller tillsammans med dem.
Det mest direkta tillvägagångssättet är att använda befintliga försäljningsdata för att förutsäga värdet på en föremålsfastighet, som en output till modellen. Det finns många källor till gratis data från lokala, statliga och federala myndigheter som kan kompletteras med privata dataleverantörer.
Ett annat alternativ är att använda regressionsmodeller för att mer exakt förutsäga indata för andra traditionella värderingsmetoder. Till exempel, när man analyserar ett kommersiellt projekt med blandad användning, kan en utvecklare bygga en modell för att förutsäga försäljningen per kvadratfot för butiksytan och en annan modell för att förutsäga hyrespriser för bostadskomponenten. Båda dessa skulle sedan kunna användas som en input till en inkomstmetod för värdering.
Att använda sunda statistiska principer ger ett mer objektivt förhållningssätt till värdering. Det är ett av de bästa sätten att undvika bekräftelsebias, som uppstår när människor söker information som bekräftar deras befintliga åsikt eller avvisar ny information som motsäger den. När jag har byggt modeller för återförsäljare för att förutsäga ny butiksförsäljning, blev de ofta förvånade över att få veta att många återförsäljare tjänar på att vara nära en konkurrent. Faktum är att samlokalisering med Walmart, som ofta var deras största konkurrent, en av de vanligaste variablerna som användes i mina modeller. Att förlita sig på befintliga fördomar kan leda till missade möjligheter, eller ännu värre, dölja katastrofer precis runt hörnet.
Några av de objektiva fördelarna med statistisk värdering är följande:
Regressionsmodeller är unika genom att de har en inbyggd kontroll för noggrannhet. Efter att ha byggt en modell på ett urval av den totala populationen kan du använda modellen på data utanför urvalet för att upptäcka möjliga provtagningsbiasar.
Traditionella värderingsmetoder har alla en betydande risk för urvalsbias. När du väljer jämförbara egenskaper är det mycket lätt att falla i fällan att välja de bästa resultaten och anta att de liknar ditt projekt mest. Det finns också en betoning på att förutsäga variabler, såsom avkastningen i inkomstsynen. Att eliminera behovet av denna förutsägelse kan vara attraktivt för många fastighetsinvesterare, varför regressionsbaserad värdering är ett användbart tillvägagångssätt.
Mängden skämt som citerar de olika procentsatserna av statistik som består av är verkligen ett skämt i sig. Vi bombarderas nästan varje dag med mediarubriker om resultaten av en ny forskningsstudie, av vilka många verkar motsäga en studie som publicerades förra året. I en värld av soundbites finns det ingen tid att diskutera rigorösheten i de metoder som forskarna använder.
Det finns många typer av regressionsanalys, men den vanligaste är linjär regression. Det finns vissa antaganden om linjära regressioner som inte bör kränkas för att anse modellen som giltig. Att bryta mot dessa antaganden förvränger statistiska tester som beräknar den prediktiva kraften hos indata och den övergripande modellen.
Det bör finnas ett linjärt samband mellan indata (oberoende variabler) och output (beroende variabel). Till exempel skulle vi kunna anta att det finns ett linjärt samband mellan de uppvärmda kvadratmeterna i ett hem och dess totala värde. Men på grund av minskande avkastning kan vi upptäcka att förhållandet är icke-linjärt, vilket kräver en omvandling av rådata.
De oberoende variablerna ska inte vara slumpmässiga. Enkelt uttryckt är observationerna för varje oberoende variabel i modellen fasta och antas inte ha något fel i deras mätning. Om vi till exempel använder antalet enheter för att modellera värdet på ett hyreshus, kommer alla byggnader i våra exempeldata att ha ett fast antal enheter som inte kommer att förändras, oavsett hur vi bygger modellen.
Modellens "rester" (d.v.s. skillnaden mellan modellens förutsagda resultat och faktiska observationer) kommer att summeras till 0, eller i enklare termer:modellen vi kommer att använda kommer att representera linjen för bästa passform.
Modellen ska vara korrekt för alla observationer för varje oberoende variabel. Om vi förutspådde värdet på ett hem baserat på dess kvadratmeter, skulle vi inte vilja använda modellen om den var extremt noggrann för att förutsäga värden för hus under 1 500 kvadratmeter, men det fanns en stor mängd fel för hem över 3 000 kvadratfot. Detta är känt som heteroskedasticitet.
Ett av de vanligaste problemen med linjär regression när man tittar på fastighetsbranschen är en korrelation av kvarvarande fel mellan observationer. Du kan tänka på detta som vitt brus som inte har något mönster. Men om det finns ett mönster för resterna behöver vi troligen göra en justering. Det här problemet är svårt att föreställa sig, men det finns två huvudområden där detta är ett problem inom fastighetsbranschen.
Att bygga en modell baserad på observationer över en lång tidsperiod skulle vara olämpligt för att förutsäga aktuella värden. Anta att vi byggde en modell för att förutsäga värdet på en hotellfastighet med hjälp av den genomsnittliga rumspriset som en oberoende variabel. Den prediktiva kraften hos denna variabel kan vara missvisande eftersom rumspriserna har stigit konsekvent över tiden. I statistiska termer finns det en autokorrelation mellan observerade genomsnittliga rumspriser som visar en positiv trend över tid (dvs inflation) som inte skulle tas med i modellen. Den traditionella jämförbara försäljningsmetoden som används mest i bostadsfastigheter eliminerar detta problem genom att endast använda de senaste uppgifterna. Eftersom det finns mycket färre antal kommersiella transaktioner, gör denna tidsbegränsning ofta den jämförbara försäljningsstrategin ineffektiv. Det finns dock tekniker som använder linjär regression som kan övervinna problemen med autokorrelation.
Klustereffekten är också en betydande utmaning vid modellering av fastighetsvärdering. Detta kan ses som rumslig autokorrelation. Det enklaste sättet att tänka på detta problem är att föreställa sig att bygga en modell för att förutsäga värdet av hus i två stadsdelar (A och B) på vardera sidan om en motorväg. Som helhet kan modellen fungera bra för att förutsäga värden, men när vi undersöker de kvarvarande felen märker vi att det finns ett mönster. Husen i stadsdel A är i allmänhet cirka 10 % övervärderade och husen i stadsdel B är ungefär 10 % undervärderade. För att förbättra vår modell måste vi ta hänsyn till denna klustereffekt eller bygga en modell för varje stadsdel.
Idealt sett kommer variabler inom en modell inte att vara korrelerade med varandra. Detta kända problem kallas multikollinearitet. Att använda både kvadratfot och antalet parkeringsplatser som input till en modell som värderar regionala gallerior skulle sannolikt visa multikollinearitet. Detta är intuitivt eftersom planeringskoder ofta kräver ett visst antal parkeringsplatser baserat på kvadratmeterantalet på en kommersiell plats. I det här exemplet skulle en borttagning av en av variablerna ge en mer exakt bedömning av den justerade modellen utan att dess prediktiva kraft avsevärt minskas.
Att använda observerade data är kärnan i alla empiriska metoder, men det är viktigt att komma ihåg att tidigare resultat inte alltid förutsäger framtiden. Illikvida tillgångar som fastigheter är särskilt känsliga för förändringar i konjunkturcykeln. Prediktivkraften för vissa variabler kommer sannolikt att förändras baserat på nuvarande ekonomiska förhållanden. Detta problem är inte unikt för linjär regression och finns även med traditionella metoder.
Korrelation är inte lika med orsakssamband. Syftet med modellbyggande är att hitta användbara variabler som gör giltiga förutsägelser. Du måste vara försiktig med falska samband. Du kanske blir förvånad över att höra att det finns en extremt stark korrelation mellan skilsmässofrekvensen i Maine och per capita konsumtion av margarin. Men att använda skilsmässodata från Maine skulle inte vara meningsfullt om du försökte förutsäga framtida margarinförsäljning.
Låt oss nu tillämpa denna kunskap praktiskt och bygga en linjär modell från början till slut. För vårt exempel kommer vi att försöka bygga en fastighetsvärderingsmodell som förutsäger värdet av enfamiljshus i Alleghany County, Pennsylvania. Valet av Alleghany County är godtyckligt, och de rektorer som visas kommer att fungera för vilken plats som helst. Vi kommer att använda Excel och SPSS, som är en vanlig statistisk programvara.
Att hitta kvalitetsdata är det första steget i att bygga en korrekt modell och kanske det viktigaste. Även om vi alla har hört frasen "skräp in, skräp ut", är det viktigt att komma ihåg att det inte finns någon perfekt datauppsättning. Detta är bra så länge vi bekvämt kan anta att urvalsdata är representativa för hela populationen. Det finns tre huvudkällor för fastighetsdata:
Vi kommer exklusivt att använda gratis data för vårt exempel, hämtad från Western Pennsylvania Regional Data Center och U.S. Census Bureau. Data från Alleghany Real Estate Sales kommer att ge oss en basfil för våra observationer med försäljningspriset som vår beroende variabel (Y-variabel). Vi kommer också att testa variabler med hjälp av gångpoängen för varje folkräkning och skattebedömningsinformation.
En mycket användbar variabel att ha när man bygger fastighetsmodeller är latitud och longitud för varje adress. Du kan få dessa data genom en geokoder som använder en gatuadress för att tilldela en latitud och longitud. U.S. Census Bureau geokoder kommer också att identifiera folkräkningssystemet för varje plats som vanligtvis används för att samla demografisk och psykografisk information.
Nu när vi har valt våra datakällor måste vi undersöka kvaliteten på datan. Det enklaste sättet att kontrollera datakvaliteten är att köra en frekvenstabell för några nyckelvariabler. Om det finns ett betydande antal saknade eller korrupta poster måste vi undersöka uppgifterna ytterligare. Tabellen nedan visar att endast 1 av 216 498 poster saknar postnummer i försäljningsfilen, och det finns inga felaktiga postnummer som 99999 eller 1X#45. Detta indikerar troligen att detta är en datauppsättning av hög kvalitet.
En dataordbok är en utmärkt resurs när den är tillgänglig. Det kommer att ge en beskrivning av vad varje variabel mäter och möjliga alternativ för variabeln. Vår data innehåller en analys av varje utförd försäljning i länet. Detta är nyckelinformation, särskilt när man arbetar med råa handlingsprotokoll. Alla fastighetstransaktioner måste registreras för att vara verkställbara enligt lag, men inte alla överföringar återspeglar det verkliga marknadsvärdet för en fastighet. Till exempel kan en försäljning mellan två familjemedlemmar ske till ett lägre pris än marknadspriset som en form av en gåva eller för att slippa betala högre transaktionskostnader som stämplar. Lyckligtvis för oss markerar den lokala regeringen tydligt överföringar som de anser inte vara representativa för nuvarande marknadsvärden, så vi kommer bara att använda register som visar en "giltig försäljning". Dessa försäljningar står för endast cirka 18 % av det totala antalet transaktioner, vilket illustrerar hur viktigt det är att förstå din data innan du börjar använda den för analys. Baserat på min erfarenhet är detta förhållande ganska vanligt när man analyserar handlingsprotokoll. Det är mycket troligt att om vi byggde en modell som inkluderar "ogiltig försäljning" skulle våra slutresultat förvrängas.
Därefter kommer vi att lägga till våra bedömningsdata och vandringspoäng till försäljningsfilen. Detta ger oss ett enda bord att använda för vår modell. Vid denna tidpunkt måste vi analysera variablerna för att se om de är lämpliga för linjär regression. Nedan finns en tabell som visar olika typer av variabler.
Vår fil innehåller flera nominella värden som grannskap eller postnummer, som kategoriserar data utan ordningssinne. Nominella värden är olämpliga för linjär regression utan transformation. Det finns också flera ordningsvariabler som graderar byggkvaliteten, fastighetens nuvarande skick etc. Användningen av ordningsdata är endast lämplig när vi rimligen kan anta att varje rang är jämnt fördelad. Till exempel har vår data en betygsvariabel med 19 olika klassificeringar (A+, A, A-, etc.), så vi kan säkert anta att dessa betyg sannolikt är jämnt fördelade.
Det finns också flera variabler som behöver transformeras innan vi kan använda dem i modellen. Ett nominellt värde som kan omvandlas till en dummyvariabel för testning är värme- och kylningsvariabeln. Vi kommer att sätta variabeln till 0 för alla fastigheter utan luftkonditionering och de med luftkonditionering till 1. Bokstavsbetygen måste också omvandlas till siffror (t.ex. 0=Sämst, 1=Bättre, 2=Bäst) för att se om det finns ett linjärt samband med priset.
Slutligen måste vi avgöra om det är lämpligt att använda alla observationer. Vi vill förutsäga värdet på enfamiljshus, så att vi kan eliminera alla kommersiella fastigheter, lägenheter och radhus från data. Vi vill också undvika potentiella problem med autokorrelation, så vi använder endast data för försäljning under 2017 för att begränsa sannolikheten att detta inträffar. När vi har eliminerat alla ovidkommande poster har vi vår slutliga datauppsättning som ska testas.
Att välja rätt provstorlek kan vara svårt. Bland akademiskt material finns ett brett utbud av minimala siffror som föreslås och olika tumregler. För vår studie är den totala populationen ganska stor, så vi behöver inte oroa oss för att ha tillräckligt för ett urval. Istället riskerar vi att ha ett urval så stort att nästan varje variabel får en statistisk signifikans i modellen. Till slut valdes cirka 10 % av posterna ut slumpmässigt för modellering.
Variabelt urval kan vara en av de svåraste delarna av processen utan statistisk programvara. Men SPSS tillåter oss att snabbt bygga många modeller från en kombination av variabler som vi har ansett lämpliga för en linjär regression. SPSS kommer automatiskt att filtrera bort variabler baserat på våra trösklar för statistisk signifikans och endast returnera de bästa modellerna.
Från våra exempeldata tog SPSS fram fem modeller. Den modell som var mest prediktiv inkluderade följande 5 variabler.
Låt oss ta en titt på resultaten från SPSS. Vårt huvudfokus kommer initialt att ligga på det R-kvadratvärde värdet som talar om för oss hur stor procentandel av variansen i den beroende variabeln (priset) som förutsägs av regressionen. Bästa möjliga värde skulle vara 1, och resultatet av vår modell är ganska lovande. Standardfelet för skattningen som mäter modellens precision ser ut att vara ganska hög på 73 091 $. Men om vi jämför det med standardavvikelsen för försäljningspriset i modellen ($160 429), verkar felet rimligt.
Modell 5 hade ett acceptabelt standardfel och klarar Durbin-Watson-testet
SPSS har inbyggd funktionalitet för att testa för autokorrelation med Durbin-Watson Test. Helst skulle värdet vara 2,0 på en skala från 0 till 4, men ett värde på 1,652 bör inte orsaka larm.
Därefter testar vi resultaten av modellen för att avgöra om det finns några bevis på heteroskedasticitet. Det finns ingen inbyggd funktionalitet för SPSS, men med detta makro skrivet av Ahmad Daryanto kan vi använda Breusch-Pagan och Koenker-testerna. Dessa tester visar att det finns heteroskedasticitet i vår modell eftersom signifikansnivån (Sig) i diagrammet nedan är under 0,005. Vår modell har brutit mot ett av de klassiska antagandena om linjär regression. Troligtvis behöver en av variablerna i modellen transformeras för att eliminera problemet. Men innan vi gör detta är det en bra idé att se vilka effekterna av heteroskedasticiteten har på prediktiva kraften hos våra oberoende variabler. Genom att använda ett makro utvecklat av Andrew F. Hayes kan vi titta på de justerade standardfelen och signifikansnivåerna för våra oberoende variabler.
Det finns heteroskedasticitet i modellen, men ytterligare tester visar att det inte påverkar de oberoende variablerna
Ytterligare tester avslöjar att de oberoende variablerna förblir statistiskt signifikanta, efter att ha tagit hänsyn till heteroskedasticiteten i modellen, så vi behöver inte nödvändigtvis ändra den för nu.
Som ett sista test kommer vi att poängsätta alla försäljningsrekord som inte var en del av det ursprungliga provet med vår modell. Detta kommer att hjälpa oss att se hur modellen presterar på en större uppsättning data. Resultaten av detta test visar att det R-kvadratvärde värdet och standardfelet för uppskattningen inte förändrades nämnvärt på den stora datamängden, vilket sannolikt indikerar att vår modell kommer att fungera som förväntat.
Att tillämpa modellen på hela datasetet visar överensstämmelse med provet, med liknande R-kvadrat- och standardfelvärden observerade
Om vi ville använda vår exempelmodell i verkligheten, skulle vi sannolikt ytterligare segmentera data för att ha flera modeller som var mer exakta eller leta efter ytterligare data för att förbättra precisionen för denna enstaka modell. Dessa steg skulle också sannolikt ta bort den heteroskedasticitet vi såg närvarande i modellen. Baserat på det faktum att vi försökte använda en enda modell för att förutsäga värdet på hus i ett län med över 1 miljon människor, borde det inte vara någon överraskning att vi inte kunde bygga den "perfekta" modellen på bara ett par timmar .
Vårt mål var att bygga en modell som förutsäger värdet på småhus. Vår analys visar att vi uppnådde det målet med en rimlig grad av precision, men är vår modell vettig?
Om vi skulle beskriva vår modell skulle vi säga att värdet på ett hus är beroende av tomtens storlek, husets kvadratmeter, kvaliteten på konstruktionen, det aktuella reparationsläget och om det har eller inte luftkonditionering. Detta verkar mycket rimligt. Faktum är att om vi jämför vår modell med de traditionella värderingsmetoderna ser vi att den är väldigt lik kostnadsmetoden, som lägger till kostnaden för att förvärva mark och bygga en ny byggnad justerad för det nuvarande inkuransläget. Men denna likhet kan vara, för att använda en regressionsfras, en falsk korrelation.
Normalt är kostnadsmetoden endast rekommenderas för värdering av nyare fastigheter, på grund av problem med att bestämma lämplig metod för avskrivning av äldre fastigheter. Med vår modell har vi skapat en liknande strategi som är användbar för fastigheter i alla åldrar, i själva verket har vi testat ålder som en oberoende variabel och kommit fram till att den inte har någon statistiskt signifikant inverkan på fastighetsvärdet!
Förhoppningsvis har du vid det här laget en bättre förståelse för grunderna i regressionsanalys. Nästa fråga är:kan det hjälpa ditt företag? Om du svarar ja på någon av dessa frågor kan du förmodligen ha nytta av att använda regressionsanalys som ett verktyg.
Exempelmodellen ovan är en enkel demonstration av värdet av att använda regressionsmodellering i fastigheter. De 2-3 timmar det tog att samla in data och bygga modellen är långt ifrån att visa sin fulla potential. I praktiken finns det en mängd olika användningsområden för regressionsanalys i fastighetsbranschen utöver fastighetsvärdering inklusive:
Geospatial modellering använder principerna för regressionsanalys parat med de tre viktigaste sakerna inom fastigheter:läge, läge, läge. Genom att arbeta som bostadsutvecklare i åtta år kan jag intyga kraften i geospatial modellering. Med ArcGIS kunde jag infoga försäljningsdata, paketkartor och lidardata för att hitta egenskaper som var idealiska för utveckling i bergen i North Carolina.
Baserat på min erfarenhet, görs det mesta av pengarna i fastigheter i förvärvet inte utvecklingen av ett projekt. Att kunna identifiera möjligheter som andra missar kan vara en enorm konkurrensfördel inom fastigheter. Geospatial analys är något stora företag har utnyttjat i många år, men mindre företag förbiser ofta.
Väldigt få människor skulle betygsätta statistik som sitt favoritämne. Faktum är att människor som helhet är väldigt dåliga på att förstå ens grundläggande sannolikheter. If you’re doubtful of this opinion, take a trip to Las Vegas or Macau. Unfortunately, this can make it difficult to determine who to trust when you’re looking for advice on implementing regression analysis in your process. Here are some key things to look for when evaluating potential candidates
While people are bad at judging probabilities, intuition is actually rather good at detecting lies. You should be very skeptical of anyone who claims to be able to build a model that will answer all your questions! Don’t trust a guarantee of results. Hopefully, this article has illustrated the fact that regression analysis is based on empirical observation and sound science. It will always be the case that certain things are easier to predict than others. A trusted advisor will be open and honest when they can’t find the answers you’re looking for, and they won’t run through your budget trying to find one that isn’t there.
Look for Mr. Spock instead of Captain Kirk. Sound research can be an excellent marketing tool, but far too often people pay for sexy marketing materials with a whiff of pseudo-research and no logic to back it up. Some people are naturally more analytical, but great analytical skills come from practice. Ideally, anyone you hire to analyze data for your business will have experience finding solutions to a wide variety of problems. Someone with a narrow focus may be more susceptible to groupthink, especially when their experiences closely mirror your own.
Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”
Finally, you should look for someone with whom you can communicate. All of the information in the world won’t help if you can’t put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren’t the right fit for your company.
Hur man blir en fastighetsutvecklare
Syftet med aktievärdering
Hur man donerar fastigheter till en stad
Sekretessavtal om fastigheter
Hur köper man fastigheter i Haiti
Vad är fastighetsgrossistförsäljning?
Crowdfunding för fastigheter:bör jag överväga det?
Uppskattning av WACC för värdering av privata företag:en handledning